ازگر کے ساتھ اعتماد کے وقفوں کو سمجھنا

ماخذ نوڈ: 1883080

اس مضمون کے ایک حصے کے طور پر شائع کیا گیا تھا۔ ڈیٹا سائنس بلاگتھون.

فہرست

  1. تعارف
  2. Z-statistic کے ساتھ اعتماد کا وقفہ
  3. اعتماد کے وقفوں کی ترجمانی کرنا
  4. z-statistic کا استعمال کرتے ہوئے CI کے لیے مفروضے۔
  5. t-statistic کے ساتھ اعتماد کے وقفے۔
  6. T-statistic کا استعمال کرتے ہوئے CI کے لیے مفروضے۔
  7. جوڑا ڈیٹا کے ساتھ ٹی وقفہ بنانا
  8. زیڈ ویلیو بمقابلہ ٹی ویلیو: کب استعمال کریں؟
  9. python کے ساتھ اعتماد کے وقفے
  10. اختتامی نوٹ

تعارف

جب بھی ہم شماریاتی مسئلہ حل کرتے ہیں تو ہم آبادی کے پیرامیٹر کے تخمینہ کے بارے میں فکر مند ہوتے ہیں لیکن زیادہ تر آبادی کے پیرامیٹرز کا حساب لگانا ناممکن کے قریب ہوتا ہے۔ اس کے بجائے ہم جو کرتے ہیں وہ یہ ہے کہ آبادی سے بے ترتیب نمونے لیں اور تخمینی آبادی کے پیرامیٹرز کی توقع کرتے ہوئے نمونے کے اعدادوشمار کا حساب لگائیں۔ لیکن ہم کیسے جان سکتے ہیں کہ نمونے آبادی کے حقیقی نمائندے ہیں یا یہ نمونے کے اعدادوشمار آبادی کے پیرامیٹرز سے کتنا انحراف کرتے ہیں؟ یہ وہ جگہ ہے جہاں اعتماد کے وقفے تصویر میں آتے ہیں۔ تو، یہ وقفے کیا ہیں؟ اعتماد کا وقفہ نمونہ کے اعدادوشمار کے اوپر اور نیچے کی قدروں کی ایک رینج ہے یا ہم اسے اس امکان کے طور پر بھی بیان کر سکتے ہیں کہ نمونے کے اعدادوشمار کے ارد گرد اقدار کی ایک رینج حقیقی آبادی کے پیرامیٹر پر مشتمل ہے۔

Z-statistic کے ساتھ اعتماد کا وقفہ

موضوع کی گہرائی میں جانے سے پہلے آئیے کچھ شماریاتی اصطلاحات سے واقف ہوں۔

آبادی: یہ تمام ملتے جلتے افراد کا مجموعہ ہے۔ مثال کے طور پر کسی شہر کی آبادی، کالج کے طلباء وغیرہ۔

نمونہ: یہ آبادی سے اخذ کردہ ملتے جلتے افراد کا ایک چھوٹا مجموعہ ہے۔ اسی طرح، بے ترتیب نمونہ آبادی سے بے ترتیب طور پر تیار کردہ نمونہ ہے۔

پیرامیٹرز: اوسط (mu)، معیاری انحراف (سگما)، تناسب (p) آبادی سے اخذ کردہ۔

اعدادوشمار: اوسط (x بار)، std انحراف (S)، تناسب (p^) نمونوں سے متعلق ہے۔

زیڈ سکور: یہ عام تقسیم پر کسی خام ڈیٹا پوائنٹ کا فاصلہ ہے جو کہ ایس ٹی ڈی انحراف کے ذریعہ نارمل بنایا گیا ہے۔ کی طرف سے دیا گیا: x-mu/sigma

ابھی ہم اعتماد کے وقفوں کے تصور میں گہرائی میں ڈوبنے کے لیے تیار ہیں۔ کسی وجہ سے، میں سمجھتا ہوں کہ خام ریاضی کی تعریفوں کے بجائے متعلقہ مثالوں کے ذریعے تصورات کو سمجھنا زیادہ بہتر ہے۔ تو آئیے شروع کرتے ہیں۔

فرض کریں، آپ 100,000 آبادی والے شہر میں رہتے ہیں اور الیکشن قریب ہے۔ ایک پولسٹر کے طور پر، آپ کو پیشن گوئی کرنی چاہیے کہ کون الیکشن جیتنے والا ہے یا تو نیلی پارٹی یا پیلی۔ لہذا، آپ دیکھتے ہیں کہ پوری آبادی سے معلومات اکٹھا کرنا تقریباً ناممکن ہے لہذا آپ تصادفی طور پر 100 لوگوں کو چن لیں۔ سروے کے اختتام پر، آپ نے پایا کہ 62% لوگ پیلے رنگ کو ووٹ دینے جا رہے ہیں۔ اب سوال یہ ہے کہ کیا ہم یہ نتیجہ اخذ کریں کہ 62% کی جیت کے امکان کے ساتھ پیلا جیتنے والا ہے یا پوری آبادی کا 62% پیلے کو ووٹ دے گا؟ ٹھیک ہے، جواب نہیں ہے. ہم یقینی طور پر نہیں جانتے کہ ہمارا تخمینہ صحیح پیرامیٹر سے کتنا دور ہے، اگر ہم ایک اور نمونہ لیں تو نتیجہ 58% یا 65% نکل سکتا ہے۔ لہذا، اس کے بجائے ہم جو کریں گے وہ یہ ہے کہ اپنے نمونے کے اعدادوشمار کے ارد گرد قدروں کی ایک رینج تلاش کریں جو زیادہ تر ممکنہ طور پر آبادی کے حقیقی تناسب کو حاصل کریں گی۔ یہاں، تناسب سے مراد فیصد ہے۔

ازگر کے ساتھ اعتماد کے وقفے

                                                                   تصویر مصنف کی ہے۔

اب، اگر ہم اس طرح کے ایک سو نمونے لیں اور ہر نمونے کے نمونے کے تناسب کو پلاٹ کریں تو ہمیں نمونے لینے کے تناسب کی ایک عام تقسیم ملے گی اور تقسیم کا اوسط آبادی کے تناسب کی سب سے زیادہ تخمینی قدر ہو گی۔ اور ہمارا تخمینہ تقسیم کے منحنی خطوط پر کہیں بھی پڑ سکتا ہے۔ 3-sigma اصول کے مطابق، ہم جانتے ہیں کہ تقریباً 95% بے ترتیب متغیرات تقسیم کے وسط سے 2 std انحراف کے اندر ہوتے ہیں۔ لہذا، ہم یہ نتیجہ اخذ کر سکتے ہیں کہ امکان ہے کہ p^ کے 2 std انحراف کے اندر ہے۔ p 95 فیصد ہے۔ یا ہم یہ بھی بتا سکتے ہیں کہ p ^ کے نیچے اور اوپر 2 std انحراف کے اندر ہونے کا امکان بھی %95 ہے۔ یہ دونوں بیانات مؤثر طریقے سے برابر ہیں۔ p^ کے نیچے اور اوپر یہ دو پوائنٹس ہمارے اعتماد کے وقفے ہیں۔

ازگر کے ساتھ اعتماد کے وقفے

                                                           تصویر مصنف کی ہے۔

اگر ہم کسی طرح سگما تلاش کر سکتے ہیں تو ہم اپنے مطلوبہ وقفہ کا حساب لگا سکتے ہیں۔ لیکن یہاں سگما آبادی کا پیرامیٹر ہے اور ہم جانتے ہیں کہ اس کا حساب لگانا اکثر ناممکن ہوتا ہے لہذا اس کے بجائے ہم نمونے کے اعدادوشمار یعنی معیاری غلطی کا استعمال کریں گے۔ یہ بطور دیا جاتا ہے۔

جہاں p^= نمونے کا تناسب، n= نمونوں کی تعداد

SE =√(0.62 ۔ 0.38/100) = 0.05

تو، 2xSE = 0.1

ہمارے ڈیٹا کے لیے اعتماد کا وقفہ (0.62-0.1,0.62+0.1) یا (0.52,0.72) ہے۔ جیسا کہ ہم نے 2xSE لیا ہے اس کا ترجمہ 95% اعتماد کا وقفہ ہے۔

اب سوال یہ ہے کہ اگر ہم 92 فیصد اعتماد کا وقفہ بنانا چاہتے ہیں تو کیا ہوگا؟ پچھلی مثال میں، ہم نے 2% اعتماد کا وقفہ بنانے کے لیے SE کے ساتھ 95 کو ضرب کیا، یہ 2 95% اعتماد کے وقفے کے لیے z-اسکور ہے (بالکل قدر 1.96 ہے) اور یہ قدر z-ٹیبل سے مل سکتی ہے۔ 92% اعتماد کے وقفے کے لیے z کی اہم قدر 1.75 ہے۔ کا حوالہ دیتے ہیں اس زیڈ سکور اور زیڈ ٹیبل کی بہتر تفہیم کے لیے مضمون۔

وقفہ بذریعہ دیا جاتا ہے: (p^ + z*.SE , p^-z*.SE)۔

اگر نمونے کے تناسب کے بجائے نمونہ کا مطلب دیا جائے تو معیاری غلطی ہوگی۔ سگما/sqrt(n)۔ یہاں سگما آبادی std انحراف ہے کیونکہ ہمارے پاس اکثر اس کی بجائے نمونہ std انحراف کا استعمال نہیں ہوتا ہے۔ لیکن یہ اکثر دیکھا گیا ہے کہ اس قسم کا تخمینہ جہاں اوسط کو نتیجہ دیا جاتا ہے وہ قدرے متعصب ہوتا ہے۔ لہٰذا اس طرح کے معاملات میں، z-statistics کے بجائے t-statistic استعمال کرنے کو ترجیح دی جاتی ہے۔

z-statistics کے ساتھ اعتماد کے وقفے کا عمومی فارمولہ دیا گیا ہے۔

یہاں، اعداد و شمار سے مراد نمونہ کا مطلب یا نمونہ تناسب ہے۔ سگماs آبادی کا معیاری انحراف ہے۔

اعتماد کے وقفوں کی ترجمانی کرنا

اعتماد کے وقفوں کی صحیح تشریح کرنا واقعی اہم ہے۔ پچھلی پولسٹر مثال پر غور کریں جہاں ہم نے اپنے 95% اعتماد کا وقفہ (0.52,0.62) شمار کیا۔ اس کا کیا مطلب ہے؟ ٹھیک ہے، 95% اعتماد کے وقفے کا مطلب ہے کہ اگر ہم آبادی سے n نمونے نکالتے ہیں تو اخذ کردہ وقفہ کا 95% صحیح آبادی کا تناسب پر مشتمل ہوگا۔ یاد رکھیں کہ 95% اعتماد کے وقفے کا مطلب یہ نہیں ہے کہ 95% امکان ہے کہ وقفہ آبادی کا صحیح تناسب پر مشتمل ہے۔ مثال کے طور پر، 90% اعتماد کے وقفے کے لیے اگر ہم آبادی سے 10 نمونے کھینچتے ہیں تو مذکورہ وقفہ میں سے 9 بار آبادی کا صحیح پیرامیٹر ہوگا۔ بہتر تفہیم کے لیے نیچے دی گئی تصویر کو دیکھیں۔

اعتماد کے وقفے کی تشریح

                                                            تصویر مصنف کی ہے۔

Z-statistic کا استعمال کرتے ہوئے اعتماد کے وقفوں کے لیے مفروضے۔

z-statistic کا استعمال کرتے ہوئے ایک درست اعتماد کا وقفہ بنانے کے لیے ہمیں کچھ مفروضے تلاش کرنے کی ضرورت ہے۔

  1. بے ترتیب نمونہ: نمونے بے ترتیب ہونے کی ضرورت ہے۔ نمونے لینے کے مختلف طریقے ہیں جیسے اسٹریٹیفائیڈ سیمپلنگ، سادہ رینڈم سیمپلنگ، بے ترتیب نمونے حاصل کرنے کے لیے کلسٹر سیمپلنگ۔
  2. عام حالت: ڈیٹا کو اس شرط کو پورا کرنا چاہیے np^>=10 اور n.(1-p^)>=10۔ اس کا بنیادی مطلب یہ ہے کہ نمونے کے ذرائع کی ہمارے نمونے لینے کی تقسیم کو نارمل ہونے کی ضرورت ہے، نہ کہ کسی بھی طرف سے ٹیڑھا ہونا۔
  3. آزاد: نمونے آزاد ہونے کی ضرورت ہے۔ نمونوں کی تعداد کل آبادی کے 10% سے کم یا اس کے برابر ہونے کی ضرورت ہے یا اگر نمونے لینے کو متبادل کے ساتھ کیا جائے۔

T-statistic کے ساتھ اعتماد کا وقفہ

کیا ہوگا اگر نمونے کا سائز نسبتاً چھوٹا ہو اور آبادی کا معیاری انحراف نہ دیا گیا ہو یا اسے فرض نہیں کیا جا سکتا؟ ہم اعتماد کا وقفہ کیسے بناتے ہیں؟ ٹھیک ہے، یہ وہ جگہ ہے جہاں t-statistic آتا ہے۔ یہاں اعتماد کا وقفہ تلاش کرنے کا بنیادی فارمولہ صرف z* کی جگہ t* کے ساتھ ہی رہتا ہے۔ عام فارمولا کی طرف سے دیا گیا ہے

جہاں S = نمونہ معیاری انحراف، n = نمونوں کی تعداد

فرض کریں، آپ نے ایک پارٹی کی میزبانی کی اور آپ اپنے مہمانوں کے ذریعہ بیئر کی اوسط کھپت کا اندازہ لگانا چاہتے ہیں۔ لہذا، آپ نے 20 افراد کا بے ترتیب نمونہ حاصل کیا اور بیئر کی کھپت کی پیمائش کی۔ نمونہ کا ڈیٹا اوسط 0f 1200 ml اور 120 ml کے std انحراف کے ساتھ ہم آہنگ ہے۔ لہذا، اب آپ 95% اعتماد کا وقفہ بنانا چاہتے ہیں۔

لہذا، ہمارے پاس نمونہ ایس ٹی ڈی انحراف، نمونوں کی تعداد، اور نمونے کا مطلب ہے۔ ہمیں صرف t* کی ضرورت ہے۔ لہذا، 95(n-19 = 1-20) کی آزادی کے ساتھ 1% اعتماد کے وقفے کے لیے t* 2.093 ہے۔ لہذا، ہمارا مطلوبہ وقفہ حساب کے بعد ہے (1256.16، 1143.83) 56.16 کی غلطی کے مارجن کے ساتھ۔ کا حوالہ دیتے ہیں اس ٹی ٹیبل کو پڑھنے کا طریقہ جاننے کے لیے ویڈیو۔

T-statistic کا استعمال کرتے ہوئے CI کے لیے مفروضے۔

z-statistic کے معاملے کی طرح یہاں t-statistic کے معاملے میں بھی کچھ شرائط ہیں جو ہمیں دیئے گئے ڈیٹا میں تلاش کرنے کی ضرورت ہے۔

  1. نمونہ بے ترتیب ہونا ضروری ہے۔
  2. نمونہ عام ہونا ضروری ہے۔ نارمل ہونے کے لیے نمونے کا سائز 30 سے ​​زیادہ یا اس کے برابر ہونا چاہیے یا اگر پیرنٹ ڈیٹاسیٹ یعنی آبادی تقریباً نارمل ہے۔ یا اگر نمونہ کا سائز 30 سے ​​کم ہے تو تقسیم تقریباً ہم آہنگ ہونے کی ضرورت ہے۔
  3. انفرادی مشاہدات کا آزاد ہونا ضروری ہے۔ اس کا مطلب یہ ہے کہ یہ 10% اصول کی پیروی کرتا ہے یا نمونے لینے کو متبادل کے ساتھ کیا جاتا ہے۔

جوڑا ڈیٹا کے لیے T- وقفہ بنانا

اب تک ہم نے صرف ایک نمونہ ڈیٹا استعمال کیا ہے۔ اب ہم دیکھیں گے کہ ہم پیئرڈ ڈیٹا کے لیے ٹی انٹرول کیسے بنا سکتے ہیں۔ جوڑا ڈیٹا میں، ہم ایک ہی فرد پر دو مشاہدات کرتے ہیں۔ مثال کے طور پر، طلباء کے پری ٹیسٹ اور پوسٹ ٹیسٹ کے نمبروں کا موازنہ کرنا یا لوگوں کے ایک گروپ پر منشیات اور پلیسبو کے اثر سے متعلق ڈیٹا۔ جوڑا ڈیٹا میں، ہم نے تیسرے کالم میں دو مشاہدات کے درمیان فرق پایا۔ ہمیشہ کی طرح، ہم اس تصور کو بھی سمجھنے کے لیے ایک مثال کے ذریعے جائیں گے،

Q. ایک استاد نے امتحان کے نتائج پر نئے نصاب کے اثرات کا جائزہ لینے کی کوشش کی۔ ذیل میں مشاہدات کے نتائج ہیں۔

جوڑا ڈیٹا کے لیے T وقفہ

                                                      تصویر مصنف کی ہے۔

جیسا کہ ہم اوسط فرق کے لیے وقفے تلاش کرنے کا ارادہ رکھتے ہیں، ہمیں فرق کے لیے صرف اعدادوشمار کی ضرورت ہے۔ ہم وہی فارمولہ استعمال کریں گے جو ہم نے پہلے استعمال کیا تھا۔

شماریاتی +- (تنقیدی قدر یا ٹی ویلیو) (اعداد و شمار کا معیاری انحراف)

xd = فرق کا مطلب، ایسd = نمونہ std انحراف، آزادی کی ڈگری کے ساتھ 95% CI کے لیے 5 t* 2.57 سے دیا جاتا ہے۔ غلطی کا مارجن = 0.97 اور اعتماد کا وقفہ (4.18,6.13)۔

فرمان: مندرجہ بالا تخمینوں سے جیسا کہ ہم دیکھ سکتے ہیں کہ اعتماد کا وقفہ صفر یا منفی اقدار پر مشتمل نہیں ہے۔ لہذا، ہم یہ نتیجہ اخذ کر سکتے ہیں کہ نئے نصاب نے طلباء کی امتحانی کارکردگی پر مثبت اثر ڈالا ہے۔ اگر اس میں صرف منفی اقدار ہوتیں تو ہم کہہ سکتے ہیں کہ نصاب پر منفی اثر پڑا۔ یا اگر اس میں صفر ہے تو اس بات کا امکان ہو سکتا ہے کہ فرق صفر تھا یا امتحان کے نتائج پر نصاب کا کوئی اثر نہ ہو۔

زیڈ ویلیو بمقابلہ ٹی ویلیو

شروع میں بہت الجھن ہے کہ کب استعمال کیا جائے۔ انگوٹھے کا اصول یہ ہے کہ جب نمونے کا سائز >= 30 ہو اور آبادی کے معیاری انحراف کو z-statistics استعمال کرنے کے لیے جانا جاتا ہے۔ اگر نمونہ کا سائز <30 ہے تو t-statistics استعمال کریں۔ حقیقی زندگی میں، ہمارے پاس آبادی کے پیرامیٹرز نہیں ہیں لہذا ہم نمونے کے سائز کی بنیاد پر z یا t کے ساتھ جائیں گے۔

چھوٹے نمونوں (n<30) کے ساتھ مرکزی LImit Theorem لاگو نہیں ہوتا ہے، اور طالب علم کی t-ڈسٹری بیوشن نامی ایک اور تقسیم استعمال کی جاتی ہے۔ ٹی ڈسٹری بیوشن عام تقسیم کی طرح ہے لیکن نمونے کے سائز کے لحاظ سے مختلف شکلیں لیتی ہے۔ z اقدار کے بجائے، t قدریں استعمال کی جاتی ہیں جو چھوٹے نمونوں کے لیے بڑی ہوتی ہیں، جس سے غلطی کا بڑا مارجن پیدا ہوتا ہے۔ جیسا کہ ایک چھوٹا سا نمونہ سائز کم عین مطابق ہوگا۔

ازگر کے ساتھ اعتماد کے وقفے

Python کے پاس ایک وسیع لائبریری ہے جو ہر قسم کے شماریاتی حسابات کو سپورٹ کرتی ہے جو ہماری زندگی کو قدرے آسان بناتی ہے۔ اس حصے میں، ہم چھوٹے بچوں کی نیند کی عادات کے اعداد و شمار کو دیکھیں گے۔ ان مشاہدات کے 20 شرکاء صحت مند تھے، نارمل سلوک کرتے تھے، انہیں نیند میں کوئی عارضہ نہیں تھا۔ ہمارا مقصد سونے کے وقت کا تجزیہ کرنا ہے اور بچوں کو نیند نہ لینا۔

حوالہ: Akacem LD, Simpkin CT, Carskadon MA, Wright KP Jr, Jenni OG, Achermann P, et al. (2015) سرکیڈین کلاک اور نیند کا وقت نیپنگ اور نان نیپنگ ٹڈلرز کے درمیان مختلف ہے۔ PLOS ONE 10(4): e0125181۔ https://doi.org/10.1371/journal.pone.0125181

ہم لائبریریاں درآمد کریں گے جن کی ہمیں ضرورت ہوگی۔

import numpy as np import pandas as pd from scipy.stats import t pd.set_option('display.max_columns', 30) # set so can see all columns of the DataFrame import math
df = pd.read_csv(nap_no_nap.csv) #ریڈنگ ڈیٹا
df.head()
ازگر کے ساتھ اعتماد کے وقفے

سونے کے اوسط وقت کے لیے دو 95% اعتماد کے وقفے بنائیں، ایک ان بچوں کے لیے جو سوتے ہیں اور ایک ان بچوں کے لیے جو نہیں لیتے۔ سب سے پہلے، ہم کالم 'رات کے سونے کا وقت' کو ان لوگوں کے لیے الگ کریں گے جو ایک نئے متغیر میں جھپکی لیتے ہیں، اور ان لوگوں کے لیے جنہوں نے دوسرے نئے متغیر میں جھپکی نہیں لی۔ یہاں سونے کا وقت اعشاریہ ہے۔

bedtime_nap = df['night bedtime'].loc[df['napping'] == 1] bedtime_no_nap = df['night bedtime'].loc[df['napping'] == 0]

پرنٹ (لین (سونے کا وقت_نیپ))

پرنٹ (لین (سونے کا وقت_نہیں_نیپ))

آؤٹ پٹ: 15 این 5


اب، ہم جھپکی اور no_nap کے لیے نمونہ کا مطلب سونے کا وقت تلاش کریں گے۔

nap_mean_bedtime = bedtime_nap.mean() #20.304 no_nap_mean_bedtime = bedtime_no_nap.mean() #19.59

اب، ہم X کے لیے نمونہ معیاری انحراف تلاش کریں گے۔جھپکی اور Xکوئی جھپکی نہیں 

nap_s_bedtime = np.std(bedtime_nap,ddof=1) no_nap_s_bedtime = np.std(bedtime_no_nap,ddof=1)

نوٹ: نمونہ std dev کے لیے ddof پیرامیٹر 1 پر سیٹ کیا گیا ہے ورنہ یہ آبادی std dev بن جائے گا۔

اب، ہم X کے لیے نمونہ معیاری خامی تلاش کریں گے۔جھپکی اور Xکوئی جھپکی نہیں 

nap_se_mean_bedtime = nap_s_bedtime/math.sqrt(len(bedtime_nap)) #0.1526 no_nap_se_mean_bedtime = no_nap_s_bedtime/math.sqrt(len(bedtime_no_nap)) #0.2270

اب تک بہت اچھا، اب چونکہ نمونہ کا سائز چھوٹا ہے اور ہمارے پاس آبادی کے تناسب کا کوئی معیاری انحراف نہیں ہے، ہم t* قدر استعمال کریں گے۔ ٹی* ویلیو تلاش کرنے کا ایک طریقہ استعمال کرنا ہے۔ scipy.stats t.ppf فنکشن t.ppf() کے دلائل q = فیصد، df = آزادی کی ڈگری، پیمانے = std dev، loc = مطلب ہیں۔ چونکہ t-تقسیم 95% اعتماد کے وقفے کے لیے ہم آہنگ ہے q 0.975 ہوگا۔ کا حوالہ دیتے ہیں اس t.ppf() پر مزید معلومات کے لیے

nap_t_star = t.ppf(0.975,df=14) #2.14 no_nap_t_star = t.ppf(0.975,df=5) #2.57

اب، ہم آخر میں اپنے اعتماد کا وقفہ بنانے کے لیے ٹکڑوں کو شامل کریں گے۔

nap_ci_plus = nap_mean_bedtime + nap_t_star* nap_se_bedtime

nap_ci_minus = nap_mean_bedtime – nap_t_star* nap_se_bedtime

پرنٹ(nap_ci_minus,nap_ci_plus)

no_nap_ci_plus = no_nap_mean_bedtime + no_nap_t_star* nap_se_bedtime

no_nap_ci_minus = no_nap_mean_bedtime - no_nap_t_star* nap_se_bedtime

پرنٹ (no_nap_ci_minus، no_nap_ci_plus)


output: 19.976680775477412 20.631319224522585 18.95974084563192 20.220259154368087

تشریح: 

مندرجہ بالا نتائج سے، ہم یہ نتیجہ اخذ کرتے ہیں کہ ہمیں 95% یقین ہے کہ چھوٹے بچوں کے لیے سونے کا اوسط وقت 19.98 - 20.63 (pm) کے درمیان ہوتا ہے جب کہ نہ سونے والے بچوں کے لیے یہ 18.96 - 20.22 (pm) کے درمیان ہوتا ہے۔ یہ نتائج ہماری توقع کے مطابق ہیں کہ اگر آپ دن میں جھپکی لیں گے تو آپ رات کو دیر سے سوئیں گے۔

اختتامی نوٹ

تو، یہ سب z اور t اقدار کا استعمال کرتے ہوئے سادہ اعتماد کے وقفوں کے بارے میں تھا۔ کسی بھی شماریاتی مطالعہ کے معاملے میں یہ جاننا واقعی ایک اہم تصور ہے۔ نمونے کے اعداد و شمار سے آبادی کے پیرامیٹرز کا اندازہ لگانے کے لیے ایک زبردست تخمینہ شماریاتی طریقہ۔ اعتماد کے وقفے مفروضے کی جانچ سے بھی منسلک ہوتے ہیں کہ 95% CI کے لیے آپ بے ضابطگیوں کے لیے 5% جگہ چھوڑ دیتے ہیں۔ اگر null hypothesis اعتماد کے وقفے کے اندر آتا ہے تو p-value بڑی ہو گی اور ہم null کو مسترد نہیں کر سکیں گے۔ اس کے برعکس، اگر یہ اس سے آگے نکلتا ہے تو ہمارے پاس null کو مسترد کرنے اور متبادل مفروضوں کو قبول کرنے کے لیے کافی ثبوت ہوں گے۔

امید ہے کہ آپ کو مضمون پسند آیا ہوگا اور نیا سال مبارک ہو (:

اس مضمون میں دکھایا گیا میڈیا Analytics ودھیا کی ملکیت نہیں ہے اور مصنف کی صوابدید پر استعمال کیا جاتا ہے۔

ماخذ: https://www.analyticsvidhya.com/blog/2022/01/understanding-confidence-intervals-with-python/

ٹائم اسٹیمپ:

سے زیادہ تجزیات ودھیا