مصنف کی طرف سے تصویر
ڈیٹا سائنٹسٹ، ڈیٹا انجینئرز، اور مشین لرننگ انجینئر اپنا بہت سا وقت ڈیٹا کو دیکھنے اور اس سے شماریاتی ڈرائنگ یا نتائج اخذ کرنے میں صرف کرتے ہیں۔ لیکن ایک بڑی چیز جو ان پیشہ ور افراد کے لیے مطلوبہ مہارت ہے اور جو بھی ڈیٹا کو دیکھ رہا ہے وہ حقیقی دنیا کے لیے اچھی بصیرت رکھتا ہے۔
ڈیٹا میں کئی متغیرات ہوتے ہیں جن پر آپ غور کر سکتے ہیں، تاہم، یہ نوٹ کرنا اچھا ہے کہ یہ ایک محدود جہتی نمائندگی پیدا کرتا ہے۔ یہ وہ جگہ ہے جہاں آپ کو ڈیٹا سے آگے دیکھنا ہوگا اور یہ معلوم کرنا ہوگا کہ پوشیدہ حقیقت کیا ہے اور اسے ڈیٹاسیٹ پر کیسے لاگو کیا جاسکتا ہے۔
سمپسن کا تضاد ہمارے لیے آپ کے ڈیٹا کی تشریح کرتے وقت شکی ہونے کی اہمیت کو ثابت کرتا ہے، اور اس بات کو یقینی بناتا ہے کہ آپ حقیقی دنیا کو لاگو کرتے ہیں – اپنے آپ کو ڈیٹا کے نقطہ نظر سے دیکھنے سے روکے بغیر۔
1972 میں کولن آر بلیتھ نے سمپسن کا پیراڈوکس نام متعارف کرایا، جسے سمپسن کا الٹ، یول سمپسن اثر، امتزاج پیراڈوکس یا ریورسل پیراڈوکس بھی کہا جاتا ہے۔
سمپسن کا تضاد تب ہوتا ہے جب کوئی رجحان یا آؤٹ پٹ موجود ہوتا ہے جب ڈیٹا کو ایسے گروپوں میں ڈالا جاتا ہے جو ڈیٹا کو جوڑنے پر یا تو الٹ جاتا ہے یا غائب ہوجاتا ہے۔ یہ ایک شماریاتی تضاد ہے جہاں یہ ایک ہی ڈیٹا سے دو متضاد نتائج اخذ کر سکتا ہے، اس پر منحصر ہے کہ ڈیٹا کو کس طرح گروپ کیا گیا ہے۔
یو سی برکلے اور سمپسن کا تضاد
سمپسن کے تضاد کی ایک مشہور مثال UC برکلے کا گریجویٹ اسکول کے داخلوں میں صنفی تعصب پر مطالعہ ہے۔ 1973 میں، تعلیمی سال کے آغاز پر، UC برکلے کے گریجویٹ اسکول نے تقریباً 44% مرد اور 35% خواتین درخواست دہندگان کو داخل کیا۔ اسکول کو خدشہ تھا کہ وہ ایک قانونی چارہ جوئی کے خلاف ہیں، اس لیے اس کے لیے ایک ماہر شماریات پیٹر بیکل سے ڈیٹا پر نظر ڈالنے کے لیے تیار ہوئے۔
اس نے جو پایا وہ یہ تھا کہ اعدادوشمار کے لحاظ سے ایک اہم صنفی تعصب تھا جو 4/6 محکموں میں خواتین کے حق میں تھا، اور یہ کہ باقی 2 میں کوئی خاص صنفی تعصب نہیں تھا۔ درخواست دہندگان کی چھوٹی فیصد
سمپسن کے پیراڈاکس میں، آپ کو حقیقی دنیا کے منظرناموں اور متغیرات پر غور کرنے کی ضرورت ہے جو کہ چھپائے جا سکتے ہیں اور ڈیٹا کے ذریعے آسانی سے تشریح نہیں کی جا سکتی۔ اس مثال میں، پوشیدہ تغیر یہ ہے کہ زیادہ خواتین ایک مخصوص شعبہ کے لیے درخواست دے رہی تھیں۔ یہ قبول شدہ درخواست دہندگان کی مجموعی فیصد کو متاثر کرتا ہے، اس طرح سے جو الٹا رجحان ظاہر کرتا ہے جو ڈیٹا میں ابتدائی طور پر موجود تھا۔
اس کے بعد ٹیم نے یہ نتیجہ اخذ کیا کہ ڈیٹا پر ان کا آؤٹ پٹ تب بدل گیا جب انہوں نے اسکول کو محکموں میں تقسیم کرتے وقت اسے مدنظر رکھا۔
نیچے دی گئی تصویر بتاتی ہے کہ جب ڈیٹا کو گروپ کیا جاتا ہے تو رجحانات کیسے الٹ جاتے ہیں:
تصویر کی طرف سے وکیپیڈیا
سمپسن کا تضاد ڈیٹا کے ساتھ کام کرنے کو مزید پیچیدہ بنا سکتا ہے اور فیصلہ سازی کے عمل کو زیادہ مشکل بنا سکتا ہے۔
اگر آپ اپنے ڈیٹا کو مختلف طریقے سے دوبارہ نمونہ بنانا شروع کرتے ہیں، تو آپ مختلف نتائج کے ساتھ سامنے آئیں گے۔ یہ قدرتی طور پر آپ کے لیے مزید بصیرت حاصل کرنے کے لیے ایک مخصوص درست نتیجے کا انتخاب کرنا مشکل بنا دے گا۔ اس کا مطلب یہ ہے کہ ٹیم کو بہترین نتیجہ تلاش کرنا ہوگا جس میں ڈیٹا کی منصفانہ نمائندگی ہو۔
ڈیٹا سے متعلقہ پروجیکٹس کے ساتھ کام کرتے وقت، ہم اکثر ڈیٹا پر توجہ مرکوز کرتے ہیں اور اس کہانی کی تشریح کرنے کی کوشش کرتے ہیں جو یہ ہمیں بتانے کی کوشش کر رہا ہے۔ لیکن اگر ہم حقیقی دنیا کے علم کا اطلاق کرتے ہیں، تو یہ ہمیں بالکل مختلف کہانی سنائے گا۔
اس کی اہمیت کو سمجھنا ہمارے لیے ڈیٹا کو گہرائی میں دیکھنے اور فیصلہ سازی کے عمل میں مدد کے لیے کافی تجزیہ کرنے کے مزید مواقع فراہم کرتا ہے۔ سمپسن کا پیراڈاکس اس بات پر توجہ مرکوز کرتا ہے کہ کس طرح کافی تجزیاتی بصیرت اور پروجیکٹ کے مجموعی علم کی کمی ہمیں گمراہ کر سکتی ہے اور غلط فیصلے کر سکتی ہے۔
مثال کے طور پر، ہم ریئل ٹائم ڈیٹا اینالیٹکس کے استعمال میں اضافہ دیکھ رہے ہیں۔ زیادہ سے زیادہ ٹیمیں پیٹرن کا پتہ لگانے میں مدد کے لیے اس پر عمل درآمد کر رہی ہیں، اور مختصر مدت میں فیصلے کرنے کے لیے اس بصیرت کا استعمال کر رہی ہیں۔ ریئل ٹائم ڈیٹا کے تجزیہ کے ساتھ کام کرنا اس وقت موثر ہوتا ہے جب آپ موجودہ ریئل ٹائم ڈیٹا کی بنیاد پر کمپنی کو بہتر بنانے کے طریقے پر توجہ مرکوز کر رہے ہوں۔ تاہم، یہ مختصر مدت گمراہ کن معلومات کا سبب بن سکتی ہے اور ڈیٹا سے ظاہر ہونے والے مجموعی حقیقی رجحان کو چھپا سکتی ہے۔
ڈیٹا کا غلط تجزیہ کمپنی کو روک سکتا ہے۔ اور ہم سب جانتے ہیں کہ غلط فیصلے ہمیشہ کسی کمپنی کو روکتے ہیں۔ اس لیے، سمپسن کے تضاد کو مدنظر رکھنے سے کمپنی کو ڈیٹا کی حدود، ڈیٹا کو چلانے والی چیزوں، اور مختلف متغیرات کو سمجھنے میں فائدہ ہوتا ہے اور تعصب کو کم رکھتا ہے۔
Simpson's Paradox ڈیٹا کے ساتھ کام کرنے والے پیشہ ور افراد کو ڈیٹا کو سمجھنے کی اہمیت اور ڈیٹا کی انٹوئیشن کی سطح کے بارے میں یاد دلانے میں مدد کرتا ہے۔ یہ تب ہوتا ہے جب بہت سارے ڈیٹا پروفیشنلز کی نرم مہارتیں خود کو پیش کریں گی، جیسے تنقیدی سوچ۔
اس کا مقصد پوشیدہ تعصبات اور متغیرات کو تلاش کرنا ہے جو ڈیٹا میں موجود ہیں، جو کہ پہلی نظر میں یا جب اعلیٰ تجزیہ کیا گیا ہو تو آسانی سے دریافت نہیں ہو سکتے۔
سمپسن کے تضاد کے بارے میں غور کرنے کی ایک بات یہ ہے کہ بہت زیادہ ڈیٹا اکٹھا کرنا جلد ہی بیکار ہو سکتا ہے اور تعصب متعارف کروانا شروع کر سکتا ہے۔ لیکن دوسری طرف، اگر ہم ڈیٹا کو اکٹھا نہیں کرتے ہیں، تو ڈیٹا معلومات اور بنیادی نمونوں میں محدود ہو سکتا ہے جو یہ ہمیں بتا سکتا ہے۔
سمپسن کے تضاد سے بچنے کے لیے، آپ کو اپنے ڈیٹا کا اچھی طرح سے جائزہ لینے کی ضرورت ہوگی اور اس بات کو یقینی بنانا ہوگا کہ آپ کو کاروباری مسئلے کی اچھی طرح سمجھ ہے۔
نشا آریہ KDnuggets میں ڈیٹا سائنٹسٹ، فری لانس ٹیکنیکل رائٹر اور کمیونٹی مینیجر ہیں۔ وہ خاص طور پر ڈیٹا سائنس کیریئر کے مشورے یا سبق اور ڈیٹا سائنس کے بارے میں تھیوری پر مبنی علم فراہم کرنے میں دلچسپی رکھتی ہے۔ وہ مختلف طریقوں کو بھی دریافت کرنا چاہتی ہیں جن سے مصنوعی ذہانت انسانی زندگی کی لمبی عمر کو فائدہ پہنچا سکتی ہے۔ ایک شوقین سیکھنے والا، اپنے تکنیکی علم اور تحریری مہارتوں کو وسیع کرنے کی کوشش کر رہا ہے، جبکہ دوسروں کی رہنمائی میں مدد کرتا ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو بلاک چین۔ Web3 Metaverse Intelligence. علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://www.kdnuggets.com/2023/03/simpson-paradox-implications-data-science.html?utm_source=rss&utm_medium=rss&utm_campaign=simpsons-paradox-and-its-implications-in-data-science
- : ہے
- $UP
- 35٪
- a
- ہمارے بارے میں
- تعلیمی
- مقبول
- اکاؤنٹ
- درست
- اعتراف کیا
- مشورہ
- کے خلاف
- مجموعی
- تمام
- ہمیشہ
- تجزیہ
- تجزیاتی
- تجزیاتی
- اور
- کسی
- ایپلی کیشنز
- اطلاقی
- کا اطلاق کریں
- درخواست دینا
- کیا
- ارد گرد
- مصنوعی
- مصنوعی ذہانت
- AS
- At
- سے اجتناب
- واپس
- کی بنیاد پر
- BE
- بن
- کیا جا رہا ہے
- نیچے
- فائدہ
- فوائد
- برکلے
- BEST
- سے پرے
- تعصب
- بگ
- وسیع کریں
- کاروبار
- by
- کر سکتے ہیں
- کیریئر کے
- کیونکہ
- میں سے انتخاب کریں
- مل کر
- کس طرح
- کمیونٹی
- کمپنی کے
- مکمل طور پر
- پیچیدہ
- یہ نتیجہ اخذ کیا
- اختتام
- غور
- اہم
- موجودہ
- اعداد و شمار
- ڈیٹا تجزیہ
- ڈیٹا تجزیات
- ڈیٹا سائنس
- ڈیٹا سائنسدان
- فیصلہ کرنا
- فیصلے
- گہرے
- شعبہ
- محکموں
- منحصر ہے
- مختلف
- غائب ہو
- نہیں
- ڈرائنگ
- آسانی سے
- اثر
- موثر
- یا تو
- انجینئرز
- کو یقینی بنانے کے
- کو یقینی بنانے ہے
- مثال کے طور پر
- بیان کرتا ہے
- تلاش
- منصفانہ
- کی حمایت
- خواتین
- اعداد و شمار
- مل
- تلاش
- پہلا
- پہلی نظر
- توجہ مرکوز
- توجہ مرکوز
- توجہ مرکوز
- کے لئے
- ملا
- فری لانس
- سے
- مزید
- جنس
- اچھا
- چلے
- گروپ کا
- رہنمائی
- ہاتھ
- ہے
- ہونے
- مدد
- مدد
- مدد کرتا ہے
- پوشیدہ
- ذاتی ترامیم چھپائیں
- ہائی
- پکڑو
- کس طرح
- کیسے
- تاہم
- HTTPS
- انسانی
- تصویر
- پر عمل درآمد
- اثرات
- اہمیت
- کو بہتر بنانے کے
- in
- معلومات
- ابتدائی طور پر
- بصیرت
- بصیرت
- انٹیلی جنس
- دلچسپی
- متعارف کرانے
- متعارف
- انترجشتھان
- IT
- میں
- فوٹو
- KDnuggets
- Keen
- جان
- علم
- جانا جاتا ہے
- نہیں
- مقدمہ
- سیکھنے والا
- سیکھنے
- انجینئرز سیکھنا
- سطح
- زندگی
- حدود
- لمیٹڈ
- لنکڈ
- لمبی عمر
- دیکھو
- تلاش
- بہت
- لو
- مشین
- مشین لرننگ
- بنا
- مینیجر
- کا مطلب ہے کہ
- زیادہ
- نام
- قدرتی طور پر
- ضرورت ہے
- of
- on
- ایک
- کھولتا ہے
- مواقع
- اس کے برعکس
- دیگر
- دیگر
- پیداوار
- مجموعی طور پر
- مارکس کا اختلاف
- خاص طور پر
- پیٹرن
- فیصد
- انجام دینے کے
- ادوار
- پیٹر
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- مقبول
- تیار
- حال (-)
- مسئلہ
- عمل
- پیشہ ور ماہرین
- منصوبے
- منصوبوں
- ثابت ہوتا ہے
- فراہم کرنے
- ڈال
- اصلی
- حقیقی دنیا
- اصل وقت
- اصل وقت کا ڈیٹا
- حقیقت
- باقی
- نمائندگی
- ضرورت
- پابندی لگانا
- الٹ
- ریورس
- کا جائزہ لینے کے
- اضافہ
- s
- اسی
- منظرنامے
- سکول
- سائنس
- سائنسدان
- سائنسدانوں
- دیکھ کر
- کی تلاش
- کئی
- مختصر
- شوز
- اہم
- شبہ
- مہارت
- مہارت
- چھوٹے
- سافٹ
- اسی طرح
- مخصوص
- خرچ
- شروع کریں
- شماریات
- کہانی
- مطالعہ
- اس طرح
- کافی
- لے لو
- لینے
- ٹیم
- ٹیموں
- ٹیک
- ٹیکنیکل
- کہ
- ۔
- کے بارے میں معلومات
- ان
- خود
- لہذا
- یہ
- بات
- سوچنا
- اچھی طرح سے
- کے ذریعے
- وقت
- کرنے کے لئے
- بھی
- رجحان
- رجحانات
- سچ
- سبق
- بنیادی
- سمجھ
- افہام و تفہیم
- us
- استعمال کی شرائط
- متغیرات
- راستہ..
- طریقوں
- کیا
- جس
- حالت
- وکیپیڈیا
- گے
- خواہشات
- ساتھ
- بغیر
- خواتین
- کام کر
- دنیا
- گا
- مصنف
- تحریری طور پر
- غلط
- سال
- اور
- اپنے آپ کو
- زیفیرنیٹ