مقالات

1.14: 14 نظرية الحد المركزي


1.14: 14 نظرية الحد المركزي

14. نظرية الحدود المركزية

لنفترض أننا نريد تقدير متوسط ​​وزن التوت البري البري الناضج الذي ينمو على جبل توم جونز في نيويورك.

شجيرات التوت البري مع العنب البري الناضج.
توم جونز ماونتن. هاريمان ستيت بارك ، نيويورك.

يمكننا اختيار & # 8217t كل التوت الأزرق ووزنه. لذلك ، بدلاً من ذلك ، نجمع عينة ونجد متوسط ​​(متوسط) وزن التوت الأزرق في تلك العينة.

سيكون لعينات مختلفة من العنب البري متوسط ​​أوزان مختلفة (قليلاً).

يعد توزيع متوسط ​​الأوزان للعينات المختلفة مثالاً على أ توزيع العينات.

ال نظرية الحدود المركزية (CLT) يخبرنا أنه إذا كان حجم العينة $ n $ كبيرًا بدرجة كافية ، فإن توزيع الوسائل (لحجم عينة ثابت $ n $) سيكون طبيعيًا تقريبًا. مع زيادة $ n $ ، يتحسن التقريب.

الشيء الرئيسي هو هذا. قد لا يتم توزيع المتغير العشوائي الأصلي (مثل الوزن) بشكل طبيعي ، ومع ذلك ، إذا نظرنا إلى توزيع العينات يعني # 8217 ، فسيكون ذلك طبيعيًا تقريبًا ، بشرط أن يكون $ n $ كبيرًا بدرجة كافية.

بالنسبة للعديد من التطبيقات ، إذا كان $ n geq 30 $ ، فإن $ n $ يعتبر كبيرًا بدرجة كافية بحيث يمكن تطبيق CLT.

لنفترض أننا حصلنا على عينة بحجم $ n $ من مجتمع وأن $ x $ متغير عشوائي في هذا المجتمع. يتم إعطاء متوسط ​​هذه العينة فيما يتعلق بالمتغير العشوائي $ x $ بواسطة الصيغة
$ بار = فارك < sum_^ x_i> $
حيث $ x_i $ هي قيمة $ x $ المطبقة على $ i ^عضو العينة.

اذا نحن يصلح $ n $ ، بمعنى ، إذا احتفظنا بحجم العينة $ n $ ثابتًا ، فيمكننا اعتبار $ bar$ ليكون متغيرًا عشوائيًا يعمل على عينات بحجم $ n $ مأخوذة من تلك المجموعة السكانية.

نظرية الحدود المركزية (CLT). إذا كان $ mu_x $ و $ sigma_x $ هما الوسيط والانحراف المعياري لـ $ x $ ، إذن
$ mu _ < بار> = mu_ (المعادلة 1) $

الحالة 1. إذا كان $ n $ كبيرًا بما يكفي ، فعندئذٍ $ barسيكون $ عاديًا تقريبًا.

الحالة 2. إذا كان $ x $ عاديًا ، فحتى لو كان $ n $ صغيرًا ، $ barسيكون دولارًا طبيعيًا.

لذلك ، إذا كان $ n $ كبيرًا بما يكفي ، أو إذا كان $ x $ عاديًا في البداية ، فإن المعادلتين 1 و 2 تدلان على أنه يمكننا كتابة:

ملحوظة. إذا كان $ x $ نفسه منحرفًا بشدة ، مما يعني أن توزيع $ x $ بعيد كل البعد عن التناسق حول متوسطه ، فإن & # 8220 تقريب طبيعي & # 8221 لـ $ bar$ على أنه $ N left ( mu_ ، dfrac < سيغما_> < sqrt> right) لن يكون $ تقديرًا تقريبيًا جيدًا جدًا ، ما لم يكن $ n $ كبيرًا جدًا ، أكبر بكثير من 30.

ملحوظة. عندما نحل المشكلات ، فعادة ما نكتب هذا $ barيتم توزيع $ بشكل طبيعي ، حتى لو كتبنا $ barيتم توزيع $ بشكل طبيعي تقريبًا.

أسئلة CLT

يتم حل أسئلة CLT بنفس الطريقة التي يتم بها حل مشاكل التوزيع العادية. الاختلاف الوحيد هو أنه الآن $ sigma _ < bar> = dfrac < sigma_x> < sqrt> $.

السؤال رقم 1.
افترض أن متوسط ​​ارتفاع الزرافة هو 18 قدمًا وبانحراف معياري قدره 2 قدم. إذا قمنا بقياس ارتفاع 64 زرافة تم اختيارها عشوائيًا ، فما احتمال أن يكون متوسط ​​ارتفاع الزرافات في عينتنا بين 18 و 18.5 قدمًا؟ لنفترض أن $ x $ هو المتغير العشوائي الذي يقيس أطوال الزرافة.

حل السؤال 1.

بما أن $ n = 64 geq 30 $ ، فإن CLT تعني أن $ barسيتم توزيع $ بشكل طبيعي تقريبًا.

$ P (18 & lt bar & lt 18.5) = الفوسفور ( بار & lt 18.5) & # 8211 ف ( بار & اللفتنانت 18) دولار
$ = نص(18.5، 18، 0.25) & # 8211 نص(18, 18, 0.25)$
$= 0.9772499 – 0.5$
$ = 0.4772499 leftarrow answer $

يمكننا أيضًا حل السؤال 1 دون استخدام R.

عن طريق حساب درجات z واستخدام جدول z. النتيجة z

$ P (18 & lt bar & اللفتنانت 18.5) دولار
$ = P (z (18) & lt z ( bar) & lt z (18.5)) $
$ = P (0 & lt z & lt 2.00) $
$ = A (2.00) & # 8211 A (0.00) $
$= .9772 – .5000$
$ = .4772 leftarrow answer $

السؤال 2.
افترض أن متوسط ​​ارتفاع الزرافة هو 18 قدمًا وبانحراف معياري قدره 2 قدم. إذا قمنا بقياس ارتفاع 64 زرافة تم اختيارها عشوائيًا ، فما احتمال أن يكون متوسط ​​ارتفاع الزرافات في عينتنا أكثر من 17.8 قدمًا؟ لنفترض أن $ x $ هو المتغير العشوائي الذي يقيس أطوال الزرافة.

حل السؤال 2.

بما أن $ n = 64 geq 30 $ ، فإن CLT تعني أن $ barسيتم توزيع $ بشكل طبيعي تقريبًا.

$ P ( شريط & GT 17.8) = 1 & # 8211 ف ( بار & اللفتنانت 17.8) دولار
$ = 1 & # 8211 نص(17.8, 18, 0.25)$
$= 1 – 0.2118554$
$ = 0.7881446 leftarrow answer $

يمكننا أيضًا حل السؤال 2 دون استخدام R.

عن طريق حساب درجات z واستخدام جدول z. النتيجة z

$ P (17.8 & lt bar ) $
$ = P (z (17.5) & lt z ( bar) ) $
$ = P (-2 & lt z) $
$ = 1 & # 8211 P (z & lt -0.80) $
$ = 1 & # 8211 أ (-0.80) دولار
$= 1 – .2119$
$ = 0.7881 leftarrow answer $

السؤال 3.
افترض أن متوسط ​​وزن العنب البري هو 0.3 جرام مع انحراف معياري قدره 0.06 جرام. ما احتمال أن يكون الوزن الإجمالي لـ 36 حبة من التوت البري أقل من 11 جرامًا؟ لنفترض أن $ x $ هو المتغير العشوائي الذي يقيس أوزان التوت البري.

حل السؤال 3.

الوزن الإجمالي للتوت الأزرق في عينة أقل من 11 جرامًا يعادل متوسط ​​وزن العنب البري في العينة أقل من $ dfrac <11> <36> text$ بسبب

بما أن $ n = 36 geq 30 $ ، فإن CLT تعني أن $ barسيتم توزيع $ بشكل طبيعي تقريبًا.

لذلك $ بار sim N (0.3، 0.01) $ يقاس بالجرام.

$ P ( شريط & LT 11/36) $
$ = نص(11/36, 0.3, 0.01)$
$ = 0.7107426 leftarrow answer $

ملحوظة. في ما سبق ، وضعت 11/6 مباشرةً في وظيفة R & # 8217s غير الطبيعية بدلاً من التقريب العشري 11/6.

يمكننا أيضًا حل السؤال 3 دون استخدام R.

عن طريق حساب درجات z واستخدام جدول z.

علينا استخدام الكسور العشرية مع جدول z.

$ dfrac <11> <36> = 0.3055556 $ لذا $ P ( bar & lt 11/36) = الفوسفور ( بار & lt 0.3055556) دولار

$ P ( شريط & lt 0.3055556) دولار
$ = P (z ( bar) & lt z (0.3055556)) $
$ = P (z & lt 0.56) $
الدولار = أ (0.56) دولار
$ = .7123 leftarrow answer $

تختلف الإجابة التي نحصل عليها باستخدام الجدول z قليلاً عن الإجابة التي نحصل عليها باستخدام R لأنه يتعين علينا تقريب بعض الأرقام لاستخدام الجدول z. إجابة R & # 8217s هي الإجابة الأكثر دقة.

السؤال 4.
افترض أن متوسط ​​عمر الأشجار في الغابة هو 50 عامًا بانحراف معياري قدره 20 عامًا. أوجد احتمال أن يبلغ متوسط ​​عمر عينة عشوائية من 36 شجرة من تلك الغابة بين 49 و 51 عامًا.

حل السؤال 4.

استخدام الجدول z لإيجاد A (0.30) و A (-0.30). لمزيد من التفاصيل ، انظر الوحدة 12 بشأن التوزيع الطبيعي القياسي.

مقارنة $ mathbf$ و $ mathbf < بار>$

حيث أن $ n $ يزيد الانحراف المعياري لـ $ barانخفاض دولار. نتيجة لذلك ، مع زيادة $ n $ ، يصبح من المرجح أن يكون متوسط ​​العينة & # 8217s قريبًا من متوسط ​​المحتوى.

يوضح الشكل التالي ذلك من خلال مقارنة ملفات PDF & # 8217s لـ $ x $ و $ bar$. لاحظ أن ملف PDF الخاص بـ $ bar$ لديه ذروة أكثر حدة.

ما لم يذكر خلاف ذلك ، المحتوى الموجود على هذا الموقع مرخص بموجب ترخيص Creative Commons Attribution-NonCommercial 4.0 International License.


1.14: 14 نظرية الحد المركزي

الفصل الأول في التسلسل السنوي لنظرية الاحتمالات. الموضوعات الرئيسية هي الاستقلال ، والقوانين الضعيفة والقوية للأعداد الكبيرة ، والتقارب الضعيف ، والوظائف المميزة ، ونظريات الحدود المركزية ، والتوقع الشرطي ، وأوقات التوقف ، والوقت المنفصل ، ومقدمة لسلاسل ماركوف.

يركز الربع الربيعي (MATH-2912) على العمليات العشوائية المستمرة للوقت ، مثل عمليات Gaussian و Markov ، و Martingales المستمرة للوقت ، والحركة البراونية وخصائصها ، ومبادئ الثبات مع تطبيقات CLT و LIL ، والقوانين غير القابلة للقسمة بلا حدود وعمليات القفز.

هذا التسلسل هو في المقام الأول لطلاب الدكتوراه.

المتطلبات الأساسية: يجب أن يكون الطلاب مرتاحين مع الاحتمال النظري غير المقياس ، وأن يكون لديهم أمر التحليل الحقيقي على مستوى GA-2430 والتعرض المسبق لنظرية القياس. لاختبار مهاراتك ، أكمل الاختبار في 20 دقيقة وقارن مع الحل المنشور.

  • دوريت ، الاحتمالية: النظرية والأمثلة ، الطبعة الرابعة (الفصل 1 ، 2 ، 3 ، 5 ، 6).
  • ويليامز ، الاحتمال مع مارتينجاليس (الفصل 1 - 18).
  • بيلينجسلي ، الاحتمالية والقياس ، الطبعة الثالثة (الفصل 1-5 ، 8 ، 31–35).

الاجتماع: غرفة 317 ، دبليو 1: 00-2: 05 ، 2: 10-3: 15.

المدرب: أمير ديمبو ، غرفة 812 ، غرب 10: 00-11: 30 (حتى 15 نوفمبر) ، أو أرسل بريدًا إلكترونيًا إلى أمير على math.stanford.edu

Grader: Sanchayan Sen، Room 1309، W 10: 00-11: 30، (من 16 نوفمبر إلى 5 ديسمبر) أو إرسال بريد إلكتروني على cims.nyu.edu

الدرجات: الحكم بناء على علامة الامتحان النهائي (75٪) وجهد الواجب المنزلي (25٪).

الحل النهائي: تم النشر! الأربعاء ، 19 ديسمبر ، 12:30 - 3:30 مساءً ، الغرفة 317 ، يُسمح فقط بالكتب النصية وحلول الواجبات المنزلية وملاحظات المحاضرات. المنهج: الفصول 1-5 من الكتاب المدرسي ، باستثناء الأقسام 3.7-3.9.


14.4.3. نظرية الحد المركزي¶

سبب ظهور شكل الجرس في مثل هذه الإعدادات هو نتيجة ملحوظة لنظرية الاحتمالية المسماة نظرية الحد المركزي.

تقول نظرية الحدود المركزية أن التوزيع الاحتمالي لمجموع أو متوسط ​​العينة العشوائية الكبيرة المسحوبة مع الاستبدال سيكون طبيعيًا تقريبًا ، بغض النظر عن توزيع المجتمع الذي يتم أخذ العينة منه.

كما لاحظنا عندما كنا ندرس حدود Chebychev ، النتائج التي يمكن تطبيقها على عينات عشوائية بغض النظر عن توزيع السكان قوية جدًا ، لأننا نادرًا ما نعرف في علم البيانات توزيع السكان.

تجعل نظرية الحدود المركزية من الممكن عمل استنتاجات بمعرفة قليلة جدًا عن السكان ، بشرط أن يكون لدينا عينة عشوائية كبيرة. هذا هو السبب في أنها مركزية في مجال الاستدلال الإحصائي.


  • 1. K. Belabas، M. Bhargava and C. Pomerance، Error Estimates for the Davenport-Heilbronn theorems، ديوك ماث. ج.153(1) (2010) 173-210. كروسريف ، آي إس آي ، الباحث العلمي من جوجل
  • 2. م. بهارجافا ، قوانين التكوين العالي الثالث: معاملات الحلقات الرباعية ، آن. الرياضيات. (2)159 (2004) 1329-1360. كروسريف ، آي إس آي ، الباحث العلمي من جوجل
  • 3. M. Bhargava ، قوانين التكوين العالي IV: محددات الحلقات الخماسية ، آن. الرياضيات. (2)167 (2008) 53-94. كروسريف ، الباحث العلمي من Google
  • 4. م. بهارجافا ، كثافة مميِّزات الحلقات والحقول الخماسية ، آن. الرياضيات. (2)172(3) (2010) 1559-1591. كروسريف ، آي إس آي ، الباحث العلمي من جوجل
  • 5. P. J. Cho و H. Kim، n-Level كثافة وظائف Artin L-، كثافة العمليات رياضيات. الدقة. إشعارات2015(17) (2015) 7861-7883. كروسريف ، الباحث العلمي من Google
  • 6. P. J. Cho و H. Kim ، أصفار منخفضة من وظائف Artin L -functions ، رياضيات. Z.279(3) (2015) 669-688. كروسريف ، آي إس آي ، الباحث العلمي من جوجل
  • 7. P. D. T. نظرية الأعداد الاحتمالية I. نظريات القيمة المتوسطة (سبرينغر ، نيويورك ، 1979). منحة جوجل
  • 8. P. D. T. نظرية الأعداد الاحتمالية II. نظريات الحدود المركزية (سبرينغر ، نيويورك ، 1980). منحة جوجل
  • 9. G. James and M. Liebeck، تمثيلات وشخصيات المجموعات (مطبعة جامعة كامبريدج ، 1993). منحة جوجل
  • 10 - ن. كلينجن ، التشابهات الحسابية ، Oxford Mathematical Monographs (Oxford University Press، New York، 1998). منحة جوجل
  • 11. ناغوشي ، توزيع Hecke eigenvalues ​​، بروك. عامر. رياضيات. شركة134 (2006) 3097-3106. كروسريف ، آي إس آي ، الباحث العلمي من جوجل
  • 12. J. P. Serre، Quelques applications du théorème de densité de Chebotarev، سنة النشر. رياضيات. إنست. Hautes Études Sci.54 (1981) 323-401. كروسريف ، الباحث العلمي من Google
  • 13. J. P. Serre، Répartition asymptotique des valeurs propres de l’opérateur de Hecke T p، ج. عامر. رياضيات. شركة10 (1997) 75-102. كروسريف ، آي إس آي ، الباحث العلمي من جوجل
  • 14. A. Shankar و J. Tsimerman ، عد حقول S 5 مع مصطلح خطأ توفير الطاقة ، منتدى الرياضيات. سيجما2 (2014) e13، 1–8. كروسريف ، الباحث العلمي من Google
  • 15. تانيجوتشي وف. ثورن ، المصطلحات الثانوية في دوال العد للحقول التكعيبية ، ديوك ماث. ج.162 (2013) 2451-2508. كروسريف ، آي إس آي ، الباحث العلمي من جوجل
  • 16. أ. يانغ ، مشاكل التوزيع المرتبطة بدوال زيتا والنظرية الثابتة ، دكتوراه. أطروحة ، جامعة برينستون (2009). منحة جوجل

تحقق من كتب نظرية الأعداد الجديدة في موقعنا كتالوج الرياضيات 2021


نظرية الحدود المركزية

متغير عشوائي موزع بشكل موحد
ضع في اعتبارك عملية الاهتمام التي ارتبطت نتائجها بمتغير عشوائي Xزي موحد مع القيم المقاسة المرجح أن تكون كذلك
في أي مكان في فترات فرعية متساوية الطول ضمن الفاصل الزمني [0،2] ، متغير عشوائي موصوف بواسطة توزيع احتمالي مستمر منتظم. وتخيلوا أن هذه العملية تكررت 10000 مرة (البيانات هنا) & # 8211 هنا رسم بياني لهذه القيم Xزي موحد:

القيمة المتوقعة لـ Xزي موحد (انها تعداد السكان يعني، ميكرومتر) هو

والتباين السكاني هو

أخذ العينات
لتقدير ، لنأخذ & # 8217s ن عينات من Xزي موحد من الحجم ن وحساب متوسط ​​العينة ، سنفي كل مكان

يتم استخلاص قيم العينة من التوزيع الاحتمالي المستمر والموحد المذكور أعلاه وهي موزعة بالتساوي نتيجة ل.

وكما تم إنشاؤه باستخدام R & # 8217s رونيف دالة ، قيم العينة هي أيضا مستقل إحصائيًا بالمعنى المتبادل: لا يعتمد أي منهم بأي شكل من الأشكال على من يسبقهم (في أي مجموعة). هذا ليس صحيحًا بشكل لا لبس فيه ، ومع ذلك ، نظرًا لأن R يولد متغيرات عشوائية باستخدام شبه عشوائي الأرقام ، ولكن بالنظر إلى العدد الصغير نسبيًا للمتغيرات العشوائية التي تم إنشاؤها فيما يلي ، فإننا & # 8217 نعتبرها صحيحة هنا.

توزيعات أخذ العينات
فيما يلي توزيع العينات ، رسم بياني لوسائل العينة ، سن، ل Xزي موحد متي ن = 10000 و ن = 2 (البيانات هنا):

وهنا & # 8217s توزيع عينات ل ن = 10000 و ن = 10 (البيانات هنا):

أخيرًا ، هنا & # 8217s توزيع عينات لـ ن = 10000 و ن = 30 (البيانات هنا):

مثلث الشكل ل ن = 2 ، يبدو توزيع أخذ العينات على شكل جرس إلى حد ما ويتمحور حول القيمة المتوقعة للوحدة لـ ن = 10 و ن = 30 ، مما يدل على تقاربها مع التوزيع الطبيعي مع زيادة حجم العينة & # 8211 هنا مخطط Q-Q عادي لـ ن = 10000 و ن = 30 بيانات:

في ن = 30 ، Xزي موحد لقد اقترب توزيع العينات من التوزيع الطبيعي.

بالإضافة إلى ذلك ، لاحظ كيف يصبح توزيع العينات أكثر تركيزًا حول القيمة المتوقعة للوحدة مع زيادة حجم العينة.

تباين العشرة آلاف ن = 30 متوسط ​​العينة هو 0.0113 ، وهو قريب جدًا من تباين المجتمع لـ Xزي موحد، 1/3 ، مقسومًا على حجم العينة ، 30: (1/3) / 30 = 0.0111. ال ن = 30 عينة تباين قريب جدًا من σ 2 /ن.

إن تقارب متغير عشوائي وتوزيع أخذ العينات رقم 8217s إلى التوزيع الطبيعي والتشديد المتزامن الملحوظ حول القيمة المتوقعة للمتغير & # 8217s ، كل منها يحدث مع زيادة حجم العينة ، هي عواقب لـ نظرية الحد المركزي.

نظرية الحدود المركزية
دع <X1, X2, …, Xن> أن تكون عينة عشوائية من الحجم ن، سلسلة من الأمثلة المستقلة والموزعة بشكل متماثل لمتغير عشوائي X مستمدة من اعتباطيا توزيع الاحتمالية مع متوسط ​​السكان ،
ميكرومتر = ه[X]، و محدود التباين السكاني ، σ 2 = ه[(Xه[X]) 2]. تنص نظرية الحد المركزي على أن توزيع أخذ العينات لـ X يتقارب مع التوزيع الطبيعي مع التباين σ 2 /ن مع اقتراب حجم العينة إلى ما لا نهاية. يعني هذا التوزيع ميكرومتر، بموجب قانون الأعداد الكبيرة.

بالنظر إلى أن الافتراضات التي تستند إليها ، فإن القاعدة العامة المقبولة عمومًا فيما يتعلق بإمكانية تطبيق نظرية الحد المركزي في شكلها & # 8220classical & # 8221 أعلاه هي توزيعات أخذ العينات لأحجام العينة ن يمكن تمثيل 30 بتوزيع احتمالي عادي. ومع ذلك ، كما يوضح المثال التالي ، فإن التطبيق الأعمى لهذا المعيار & # 8217s الحد الأدنى هو أمر غير حكيم.

توزيع احتمالية لقانون القوة
لنفكر في & # 8217s في 10000 نتيجة (البيانات هنا) لعملية تنتج متغير عشوائي موزع باريتو من النوع الأول Xباريتو بقيمة متوقعة 1 وتباين 1/3 ، نفس القيمة المتوقعة والتباين كما في Xزي موحد في الاعلى. هنا هو الرسم البياني ل Xباريتو ≤ 3.5:

في حين Xباريتو يشترك في يعني والاختلاف مع Xزي موحد، توزيع التردد له ذيل & # 8220 سميك & # 8221 يفتقر إلى نظيره المحدود [0،2] ، بحكم التعريف. في الواقع ، الحد الأقصى لقيمة Xباريتو في عينة 10000 ما يقرب من 12.25 ، كامل 22 الانحرافات المعيارية عن المتوسط. هنا هو الرسم البياني للقيم 58 (البيانات هنا) من Xباريتو أكبر من 3.5 ، بالنسبة إلى الذيل البعيد للتوزيع (حيث لا يمكن تمييز أي صناديق مدرج تكراري في نسخة موسعة من الشكل أعلاه & # 8211 ، سيمنع حجم المؤامرة من عرضها):

لاحظ التشابه بين هذه المؤامرة وتلك الخاصة بـ Xباريتو ≤ 3.5.

دالة كثافة الاحتمال (pdf) من أجل Xباريتو هو مثال على ذلك المقابل لـ قوة القانون توزيع الاحتمالات:

Xباريتو لها قيمة متوقعة من 1 والتباين 1/3 عندما α = 3 و
xم = 2/3. يتم الحصول على هذه القيم عن طريق الحل

تخضع الى ميكرومتر = 1 و σ 2 = 1/3.

في المقابل ، فإن ملف pdf الخاص بـ Xزي موحد هو:

فيما يلي ملفات PDF الخاصة بـ Xباريتو و Xزي موحد:

توزيعات عينات تعاونية أقل
كما فعلنا من أجل Xزي موحد، أنشأنا ن = 10000 و ن = 2 و 10 و 30 توزيعات أخذ العينات لـ Xباريتو. تم اقتطاعها عند القيمة المتوسطة للعينة سن = 3 ، وبعد ذلك لا يمكن تمييز أي صناديق ذات ارتفاع مرئي تقريبًا.

توزيع العينات ل ن = 10000 و ن = 2 (البيانات هنا):

توزيع العينات ل ن = 10000 و ن = 10 (البيانات هنا):

توزيع العينات ل ن = 10000 و ن = 30 (البيانات هنا):

الأمثلة التي تم أخذ عينات منها من Xباريتو استيفاء الافتراضات التي تشكل الأساس لنظرية الحد المركزي (الاستقلال الإحصائي المتبادل ، والتوزيع المتطابق ، والمستمدة من مجموعة سكانية ذات تباين محدود) ، وبينما تصبح توزيعات العينات المرتبطة أعلاه أكثر تركيزًا مركزيًا وأقل انحرافًا إيجابيًا مع زيادة حجم العينة ، بشكل واضح ليس عادي ، حتى في ن = 30 حالة.

ومع ذلك ، إذا أخذنا بروح المبالغة ن = 10000 (مع ن = 10000 كما كان من قبل) ، نحصل على توزيع عينات عادي تقريبًا لـ Xباريتو (البيانات هنا):

ولكن حتى القفز ن = 10000 فشل في رؤية Xباريتو توزيع العينات تماما تقارب مع ذيل عادي & # 8211 لاحظ الذيل الأيسر الأرق قليلاً باستمرار والذيل الأيمن الأكثر سمكًا نسبيًا في الرسم البياني أعلاه مباشرة والمشار إليه بمؤامرة QQ العادية التالية ، بما يتوافق مع الاتجاه (ببطء) تقليل الانحراف الإيجابي مع زيادة العينة بحجم.

بالنسبة إلى Pareto Type I ، يتم توزيع متغير عشوائي مع α = 3 ، يجب أن يكون حجم العينة أكبر بكثير من 30 عن عواقب الحد المركزي لإظهار نفسها بشكل كامل.

بالحديث عن المظاهر الكاملة لنظرية الحد المركزي ، تباين العشرة آلاف ن = 10000 يعني العينة هو 3.31e-05 ، وهو قريب جدًا من تباين السكان لـ Xباريتو، 1/3 ، مقسومًا على حجم العينة ، 10000: (1/3) / 10000 = 3.33e-05. ال ن = 10000 عينة تباين قريب جدًا من σ 2 /ن.

اخترنا عن قصد فحص توزيعات أخذ العينات لمتوسط ​​تعداد متطابق وتباين (اللحظتان الأولى والثانية متطابقتان ، حيث تكون المساواة بين الأخيرة أكثر أهمية) المتغيرات العشوائية Xزي موحد و Xباريتو & # 8211 تنطبق نظرية الحد المركزي فيما يتعلق بكل منها ، لكن هذا ينطبق على Xزي موحد يتقارب مع التوزيع الطبيعي بسرعة أكبر بكثير من التوزيع الطبيعي Xباريتو.

بوستسكريبت
عند الاقتضاء ، تسمح لنا نظرية الحد المركزي باستخدام التوزيع الطبيعي المفهوم جيدًا عند وصف وسائل العينة للمتغيرات العشوائية ذات التوزيعات الاحتمالية التعسفية ، ولكن قد تتطلب المتغيرات العشوائية مع توزيعات احتمالية قانون الطاقة كبير للغاية أحجام العينة لعرض عينة موزعة بشكل طبيعي تعني أن تميل نحو هذه المتغيرات العشوائية & # 8217 القيم المتوقعة.

العواقب (الكارثية في كثير من الأحيان) لافتراض وسائل العينة الموزعة بشكل طبيعي في المواقف التي تنطوي على ظواهر (مالية ، خاصة) الموصوفة بواسطة قانون السلطة والتوزيعات الاحتمالية الأخرى & # 8220fat-tailed & # 8221 هي مجال اهتمام وابتكار لنسيم نيكولاس طالب هو من & # 8220black swan & # 8221 شهرة.

في سياق أقل دراماتيكية ولكنه مهم ، ضع في اعتبارك مصطلح الخطأ ، في نموذج خطي لبعض كمية الفائدة ذ:

مصطلح الخطأ هذا ، والذي يمثل التباين في ذ لا شرح بالمتغيرات xأنا، يُفترض عادةً أن يكون متغيرًا عشوائيًا يمتلك متوسط ​​صفر. في بعض الحالات يُفترض بالإضافة إلى ذلك & # 8211 عبر نظرية الحد المركزي & # 8211 أن يتم توزيعها بشكل طبيعي ، على أساس الاعتقاد بأنها تمثل متوسط ​​التأثيرات العشوائية المستقلة.

تتجاوز نظرية الحد المركزي & # 8217s في الانحدار الخطي والمتعدد الأسئلة المتعلقة بطبيعة مصطلح الخطأ ، ونحن & # 8217ll نتعمق في ذلك بشكل أعمق في منشور أو اثنتين نتبعهما.

وفي المنشورات الأخرى التي يجب متابعتها & # 8217 ، سيكون لدينا المزيد فيما يتعلق بنظرية الحد المركزي في سياق المتغيرات العشوائية ذات الذيل السميك ، ونناقش أيضًا طبيعة هذه المتغيرات & # 8217 الالتزام بقانون الأعداد الكبيرة.

كود R.
انقر فوق الروابط التالية للحصول على رمز R المشروح المستخدم لإنشاء البيانات والنتائج الرقمية والمؤامرات الواردة في هذا المنشور:


نظرية الحدود المركزية (الموضوع 14 في الإحصاء) # 20

تم وصف نظرية الحد المركزي في قسم قيم P في الإحصاء ، ويمكن استخدام الوصف في وقت سابق بدلاً من وجود موضوع فارغ.

تخفيض السعر:
نظرية الحد المركزي

تنص النظرية على أن متوسط ​​توزيع العينات لعينة العينة يساوي متوسط ​​السكان بغض النظر عما إذا كان توزيع السكان حيث يكون حجم العينة أكبر من 30.

سيتبع توزيع أخذ العينات من متوسط ​​أخذ العينات أيضًا التوزيع الطبيعي.

لذلك ، ينص على أنه إذا اخترنا عدة عينات من توزيع بحجم أكبر من 30 ، واخترنا عينة ثابتة واستخدمنا وسائل العينة لإنشاء توزيع ، فإن متوسط ​​توزيع العينات الذي تم إنشاؤه حديثًا يساوي متوسط ​​السكان الأصلي .

وفقًا للنظرية ، إذا رسمنا عينات من الحجم N ، من مجموعة سكانية ذات متوسط ​​سكاني μ والانحراف المعياري للسكان ، فإن الشرط قائم:

أي ، متوسط ​​توزيع العينة يساوي متوسط ​​العينة.

يتم إعطاء الانحراف المعياري لوسائل العينة من خلال:

تم تحديث النص بنجاح ، ولكن تمت مواجهة هذه الأخطاء:

لا يمكننا تحويل المهمة إلى مشكلة في الوقت الحالي. حاول مرة اخرى.

تم إنشاء المشكلة بنجاح ولكن لا يمكننا تحديث التعليق في الوقت الحالي.


نظرية الحد المركزي

في نظرية الاحتمالات ، تنص نظرية الحد المركزي (CLT) على أنه في بعض الحالات ، عند إضافة متغيرات عشوائية مستقلة ، فإن مجموعها المقيس بشكل صحيح يميل نحو التوزيع الطبيعي (بشكل غير رسمي "منحنى الجرس") حتى لو لم تكن المتغيرات الأصلية نفسها موزع طبيعيا. النظرية هي مفهوم رئيسي في نظرية الاحتمالات لأنها تشير إلى أن الطرق الاحتمالية والإحصائية التي تعمل من أجل التوزيعات العادية يمكن أن تكون قابلة للتطبيق على العديد من المشاكل التي تنطوي على أنواع أخرى من التوزيعات.

- ويكيبيديا

لتصور هذا ، دعنا ننشئ عينة من 1.000.000 رقم عشوائي من 0 إلى 100 ورسم مخطط حيث يمثل المحور السيني رقمًا عشوائيًا والمحور الصادي - عدد المرات التي يظهر فيها الرقم في عينتنا:

يبدو وكأنه موزعة بشكل متساوٍ أكثر أو أقل.

الآن دعونا ننشئ عينة أخرى باستخدام نفس الوظيفة العشوائية () ، ولكن لإنشاء كل رقم ، سنضيف نتيجة عشوائية واحدة إلى أخرى: عشوائي () + عشوائي ():

يبدو هذا كزاوية ، دعنا نضيف المزيد من الأرقام العشوائية معًا: عشوائي () + عشوائي () + عشوائي ():


نظرية الحدود المركزية مع السكان العاديين

يوضح الشكل أدناه خاصية موزعة بشكل طبيعي ، X ، في مجتمع يكون فيه متوسط ​​عدد السكان 75 مع انحراف معياري قدره 8.

إذا أخذنا عينات عشوائية بسيطة (مع الاستبدال) بحجم n = 10 من السكان وحسبنا المتوسط ​​لكل عينة ، فيجب أن يكون توزيع متوسط ​​العينة طبيعيًا تقريبًا وفقًا لنظرية الحدود المركزية. لاحظ أن حجم العينة (n = 10) أقل من 30 ، ولكن يتم توزيع السكان المصدر بشكل طبيعي ، لذا فهذه ليست مشكلة. يتم توضيح توزيع وسائل العينة أدناه. لاحظ أن المحور الأفقي يختلف عن الرسم التوضيحي السابق وأن النطاق أضيق.

متوسط ​​متوسط ​​العينة 75 والانحراف المعياري لمتوسط ​​العينة 2.5 ، مع حساب الانحراف المعياري لمتوسط ​​العينة على النحو التالي:

إذا أخذنا عينات من n = 5 بدلاً من n = 10 ، فسنحصل على توزيع مماثل ، لكن الاختلاف بين متوسط ​​العينة سيكون أكبر. في الواقع ، عندما فعلنا ذلك ، حصلنا على متوسط ​​عينة = 75 وانحراف معياري عينة = 3.6.


يتم إجراء دراسة تنطوي على الإجهاد بين الطلاب في الحرم الجامعي. تتبع درجات الإجهاد توزيعًا موحدًا مع أدنى درجة إجهاد تساوي واحد وأعلى درجة تساوي خمسة. باستخدام عينة من 75 طالبًا ، ابحث عن:

  1. احتمال أن يكون يعني درجة الإجهاد بالنسبة لـ 75 طالبًا أقل من اثنين.
  2. النسبة المئوية التسعون لـ يعني درجة الإجهاد لـ 75 طالبًا.
  3. احتمال أن يكون مجموع درجات الإجهاد 75 أقل من 200.
  4. النسبة المئوية التسعون لـ مجموع نقاط الإجهاد لـ 75 طالبًا.

تطلب منك المشكلتان "أ" و "ب" إيجاد احتمال أو نسبة مئوية لـ a يعني. تطلب منك المشكلتان (ج) و (د) إيجاد احتمال أو نسبة مئوية لـ a المجموع أو المجموع. حجم العينة ، ن، يساوي 75.

نظرًا لأن درجات الإجهاد الفردية تتبع توزيعًا موحدًا ،
X

للمشكلتين 1. و 2. ، دع [اللاتكس] يعرض الخط الفاصل[/ لاتكس] = متوسط ​​درجة الإجهاد لـ 75 طالبًا. ثم،

مثال

  1. ابحث عن P ([اللاتكس] displaystyleoverline< normalcdf [latex]displaystyle<(<1>,<2>,<3>,frac<<1.15>>>>)> = <0> [/ لاتكس]
    تذكر أن أقل درجة ضغط هي واحدة.

تبلغ النسبة المئوية التسعون لمتوسط ​​75 درجة حوالي 3.2. هذا يخبرنا أن 90٪ من جميع وسائل 75 درجة إجهاد هي 3.2 على الأكثر ، و 10٪ على الأقل 3.2. InvNorm للمشاكل c و d ، دعنا
ΣX = مجموع درجات الإجهاد 75. ثم ، [اللاتكس] displaystylesum<[<(<75>)> <(<3>)> ، <(sqrt <<75>>)> <(<1.15>)>]> [/ لاتكس]

3. متوسط ​​مجموع 75 درجة ضغط هو (75) (3) = 225 الانحراف المعياري لمجموع 75 درجة ضغط هو
[لاتكس] displaystyle <(sqrt <<75>>)> [/ latex] (1.15) = 9.96
ص(Σx & lt 200) = 0

احتمال أن يكون إجمالي النقاط البالغ 75 أقل من 200 هو حوالي صفر. normalcdf (75،200، (75) (3)، [لاتكس] displaystyle <(sqrt <<75>>)> [/ latex] (1.15)).
تذكر، أصغر مجموع من درجات الإجهاد 75 هو 75 ، لأن أصغر درجة فردية هي واحدة.

النسبة المئوية التسعون لمجموع 75 درجة هي حوالي 237.8. هذا يخبرنا أن 90٪ من مجموع 75 درجة لا تزيد عن 237.8 وأن 10٪ لا تقل عن 237.8. invNorm (0.90، (75) (3)، [لاتكس] displaystyle <(sqrt <<75>>)> [/ latex] (1.15)) = 237.8

جربها

استخدم المعلومات الموجودة في & # 8220 Central Limit Theorem للحصول على متوسط ​​وحاصل أمثلة & # 8220 ، ولكن استخدم حجم عينة من 55 للإجابة على الأسئلة التالية.

  1. ابحث عن نمط عرض [اللاتكس]

    <(تسطير <> <> <170>)> [/ لاتكس].

  2. أوجد المئين 80 لمتوسط ​​55 درجة.
  3. أوجد المئين 85 لمجموع 55 درجة.

مثال

لنفترض أن محلل أبحاث السوق لشركة هواتف خلوية أجرى دراسة لعملائهم الذين تجاوزوا الحد الزمني المدرج في عقد الهاتف الخلوي الأساسي الخاص بهم ، وجد المحلل أنه بالنسبة لأولئك الأشخاص الذين تجاوزوا الوقت المدرج في عقدهم الأساسي ، الوقت الزائد المستخدم يتبع أ توزع استثنائى بمتوسط ​​22 دقيقة.

ضع في اعتبارك عينة عشوائية من 80 عميلًا تجاوزوا الحد الزمني المتاح في عقد الهاتف الخلوي الأساسي.

يترك X = الوقت الإضافي الذي يستخدمه عميل الهاتف الخلوي الفردي الذي يتجاوز الوقت المتعاقد عليه.

[اللاتكس] displaystyle

<(فارك <<1>> <<22>>)> [/ لاتكس]. من الفصول السابقة ، نعلم ذلك ميكرومتر = 22 و σ = 22.

دع [لاتكس] يعرض ستايل أوفرلاين <> [/ اللاتكس] = متوسط ​​الوقت الزائد الذي تستخدمه عينة من ن = 80 عميلاً تجاوزوا الحد الزمني المتعاقد معهم.

[اللاتكس] displaystyleoverline <><(<22> ، فارك <<22>> <>>>)> [/ latex] بواسطة نظرية الحد المركزية لوسائل العينة

  1. استخدام clt لإيجاد الاحتمال. أوجد احتمال أن يكون متوسط ​​الوقت الزائد الذي استخدمه 80 عميلًا في العينة أطول من 20 دقيقة. هذا يطلب منا العثور على نمط العرض [اللاتكس]

    <(تسطير <> <>> <20>)> [/ لاتكس]. ارسم الرسم البياني.

  2. استخدام clt لإيجاد الاحتمال. لنفترض أن أحد العملاء الذي تجاوز الحد الزمني لعقد الهاتف الخلوي الخاص به تم اختياره عشوائيًا. أوجد احتمال أن يكون الوقت الزائد لهذا العميل الفردي أطول من 20 دقيقة. هذا يطلب منا أن نجد ص(x & GT 20).
  3. استخدام clt لإيجاد الاحتمال. اشرح سبب اختلاف الاحتمالات في الجزأين 1 و 2.
  4. استخدام clt لإيجاد النسب المئوية. أوجد النسبة المئوية 95 للعينة تعني الوقت الزائد لعينات من 80 عميلًا تجاوزوا حدود وقت العقد الأساسي. ارسم رسمًا بيانيًا.
  1. ابحث عن: [اللاتكس] displaystyle

    <(تسطير <> <>> <20>)> [/ لاتكس] [لاتكس] displaystyle

    <(تسطير <> <>> <20>)> = <0.79199> [/ latex] باستخدام normalcdf
    [لاتكس] displaystyle <(<20> ، <1> text، <22> ، فارك <<22>>>>)> [/ latex] الاحتمال هو 0.7919 أن متوسط ​​الوقت الزائد المستخدم أكثر من 20 دقيقة ، لعينة من 80 عميلًا تجاوزوا الوقت المسموح به المتعاقد عليهم. InvNorm = 26.0

المئين 95 ل العينة تعني الوقت الزائد المستخدم حوالي 26.0 دقيقة للعينات العشوائية لـ 80 عميلًا الذين تجاوزوا الوقت المسموح به في العقد. خمسة وتسعون بالمائة من هذه العينات سيكون لها وسائل أقل من 26 دقيقة فقط خمسة بالمائة من هذه العينات سيكون لها وسائل تزيد عن 26 دقيقة.

جربها

استخدم المعلومات الواردة في المثال 2 ، ولكن قم بتغيير حجم العينة إلى 144.

  1. ابحث عن نمط عرض [اللاتكس]

    <(<20>

  2. باستخدام ض- معادلة النتيجة ، [اللاتكس] displaystyle= فارك <<>-_<>>>><<_<>>>> [/ لاتكس]. لدينا حل من أجل x x = 2(0.05) + 2 = 2.1
  3. ال IQR هو 75 بالمائة - 25 بالمائة = 203.37 - 196.63 = 6.74

جربها

استنادًا إلى بيانات المسح الصحي الوطني ، فإن النساء اللواتي تتراوح أعمارهن بين [اللاتكس] 18 [/ اللاتكس] و [اللاتكس] 24 [/ اللاتكس] لديهن متوسط ​​ضغط الدم الانقباضي (بالمليمتر الزئبقي) من [اللاتكس] 114.8 [/ اللاتكس ] مع الانحراف المعياري [اللاتكس] 13.1 [/ اللاتكس]. ضغط الدم الانقباضي للنساء بين أعمار [اللاتكس] 18 [/ اللاتكس] إلى [اللاتكس] 24 [/ اللاتكس] يتبع التوزيع الطبيعي.

  1. إذا تم اختيار امرأة من هذه المجموعة بشكل عشوائي ، فابحث عن احتمال أن يكون ضغط الدم الانقباضي لديها أكبر من [اللاتكس] 120 [/ اللاتكس].
  2. إذا تم اختيار النساء [اللاتكس] 40 [/ اللاتكس] عشوائيًا ، فابحث عن احتمال أن يكون متوسط ​​ضغط الدم الانقباضي لديهن أكبر من [اللاتكس] 120 [/ اللاتكس].
  3. إذا كانت العينة من أربع نساء تتراوح أعمارهن بين [لاتكس] 18 [/ لاتكس] إلى [لاتكس] 24 [/ لاتكس] ولم نكن نعرف التوزيع الأصلي ، فهل يمكن استخدام نظرية الحد المركزي؟
  1. ص(x & GT 120) = cdf العادي (120،99،114.8،13.1) = 0.0272. هناك حوالي 3٪ ، أن المرأة المختارة عشوائياً سيكون لديها ضغط دم انقباضي أكبر من [اللاتكس] 120 [/ لاتكس].
  2. ص(& GT 120) = normalcdf.
    هناك فرصة بنسبة 0.6٪ فقط أن يكون متوسط ​​ضغط الدم الانقباضي للمجموعة المختارة عشوائيًا أكبر من [اللاتكس] 120 [/ اللاتكس].
  3. لا يمكن استخدام نظرية الحد المركزي إذا كان حجم العينة أربعة ولم نكن نعرف أن التوزيع الأصلي طبيعي. سيكون حجم العينة صغيرًا جدًا.

مثال

تم إجراء دراسة حول العنف ضد البغايا وأعراض إجهاد ما بعد الصدمة الذي أصابهن. كان النطاق العمري للبغايا من 14 إلى 61. وكان متوسط ​​العمر 30.9 سنة مع انحراف معياري قدره تسع سنوات.

  1. في عينة مكونة من 25 بائعة هوى ، ما هو احتمال أن يكون متوسط ​​عمر البغايا أقل من 35؟
  2. هل من المحتمل أن يكون متوسط ​​عمر مجموعة العينة أكثر من 50 عامًا؟ فسر النتائج.
  3. في عينة من 49 مومس ، ما هو احتمال ألا يقل مجموع الأعمار عن 1600؟
  4. هل من المحتمل أن يكون مجموع أعمار 49 عاهرة هو 1595 كحد أقصى؟ فسر النتائج.
  5. أوجد النسبة المئوية 95 للعينة متوسط ​​عمر 65 بائعة هوى. فسر النتائج.
  6. أوجد النسبة المئوية التسعين لمجموع أعمار 65 عاهرة. فسر النتائج.
  1. ص(& lt 35) = normalcdf (-ه99,35,30.9,1.8) = 0.9886
  2. ص(& GT 50) = normalcdf (50 ، ه99،30.9،1.8) ≈ 0. بالنسبة لمجموعة العينة هذه ، يكاد يكون من المستحيل أن يكون متوسط ​​عمر المجموعة & # 8217s أكثر من 50. ومع ذلك ، لا يزال من الممكن للفرد في هذه المجموعة أن يكون عمره أكبر من 50 .
  3. ص(Σx ≥ 1600) = cdf العادي (1600 ، E99 ، 1514.10 ، 63) = 0.0864
  4. ص(Σx ≤ 1،595) = cdf العادي (-E99،1595،1514.10،63) = 0.9005. هذا يعني أن هناك فرصة بنسبة 90٪ لمجموع الأعمار لمجموعة العينة ن = 49 هي 1595 كحد أقصى.
  5. The 95th percentile = invNorm (0.95,30.9,1.1) = 32.7. This indicates that 95% of the prostitutes in the sample of 65 are younger than 32.7 years, on average.
  6. The 90th percentile = invNorm (0.90,2008.5,72.56) = 2101.5. This indicates that 90% of the prostitutes in the sample of 65 have a sum of ages less than 2,101.5 years.

Try it

According to Boeing data, the 757 airliner carries 200 passengers and has doors with a mean height of 72 inches. Assume for a certain population of men we have a mean of 69.0 inches and a standard deviation of 2.8 inches.

  1. What mean doorway height would allow 95% of men to enter the aircraft without bending?
  2. Assume that half of the 200 passengers are men. What mean doorway height satisfies the condition that there is a 0.95 probability that this height is greater than the mean height of 100 men?
  3. For engineers designing the 757, which result is more relevant: the height from part 1 or part 2? لماذا ا؟
  4. We know that ميكرومترx = ميكرومتر = 69 and we have σx = 2.8. The height of the doorway is found to be invNorm (0.95,69,2.8) = 73.61
  5. We know that ميكرومترx = ميكرومتر = 69 and we have σx = 0.28. So, invNorm (0.95,69,0.28) = 69.49
  6. When designing the doorway heights, we need to incorporate as much variability as possible in order to accommodate as many passengers as possible. Therefore, we need to use the result based on part 1.

Historical Note: Normal Approximation to the Binomial

Historically, being able to compute binomial probabilities was one of the most important applications of the central limit theorem. Binomial probabilities with a small value for ن(say, 20) were displayed in a table in a book. To calculate the probabilities with large values of ن, you had to use the binomial formula, which could be very complicated. Using the normal approximation to the binomial distribution simplified the process. To compute the normal approximation to the binomial distribution, take a simple random sample from a population. You must meet the conditions for a binomial distribution:

  • there are a certain number ن of independent trials
  • the outcomes of any trial are success or failure
  • each trial has the same probability of a success p

Recall that if X is the binomial random variable, then X

ب(n, p). The shape of the binomial distribution needs to be similar to the shape of the normal distribution. To ensure this, the quantities np و nq must both be greater than five (np > 5 and nq > 5 the approximation is better if they are both greater than or equal to 10). Then the binomial can be approximated by the normal distribution with mean ميكرومتر = np and standard deviation . Remember that q = 1 – p. In order to get the best approximation, add 0.5 to x or subtract 0.5 from x (use x + 0.5 or x – 0.5). The number 0.5 is called the continuity correction factor and is used in the following example.

Example

Suppose in a local Kindergarten through 12th grade (K – 12) school district, 53 percent of the population favor a charter school for grades K through 5. A simple random sample of 300 is surveyed.

  1. Find the probability that at least 150 favor a charter school.
  2. Find the probability that at most 160 favor a charter school.
  3. Find the probability that more than 155 favor a charter school.
  4. Find the probability that fewer than 147 favor a charter school.
  5. Find the probability that exactly 175 favor a charter school.

يترك X = the number that favor a charter school for grades K trough 5. X

ب(n, p) where ن = 300 and p = 0.53. حيث np > 5 and nq > 5, use the normal approximation to the binomial. The formulas for the mean and standard deviation are ميكرومتر = np and . The mean is 159 and the standard deviation is 8.6447. The random variable for the normal distribution is Y. Y

For part a, you include 150 so ص(X ≥ 150) has normal approximation ص(Y ≥ 149.5) = 0.8641.

normalcdf (149.5,10^99,159,8.6447) = 0.8641.

For part b, you include 160 so ص(X ≤ 160) has normal approximation ص(Y ≤ 160.5) = 0.5689.

normalcdf (0,160.5,159,8.6447) = 0.5689

For part c, you exclude 155 so ص(X > 155) has normal approximation ص(ذ > 155.5) = 0.6572.

normalcdf (155.5,10^99,159,8.6447) = 0.6572.

For part d, you exclude 147 so ص(X < 147) has normal approximationص(Y < 146.5) = 0.0741.

normalcdf (0,146.5,159,8.6447) = 0.0741

For part e, ص(X = 175) has normal approximation ص(174.5 < Y < 175.5) = 0.0083.

normalcdf (174.5,175.5,159,8.6447) = 0.0083

Because of calculators and computer software that let you calculate binomial probabilities for large values of ن easily, it is not necessary to use the the normal approximation to the binomial distribution, provided that you have access to these technology tools. Most school labs have Microsoft Excel, an example of computer software that calculates binomial probabilities. Many students have access to the TI-83 or 84 series calculators, and they easily calculate probabilities for the binomial distribution. If you type in “binomial probability distribution calculation” in an Internet browser, you can find at least one online calculator for the binomial.

For Example 3, the probabilities are calculated using the following binomial distribution: ( ن = 300 and p = 0.53). Compare the binomial and normal distribution answers.

ص(X ≥ 150) : 1 - binomialcdf (300,0.53,149) = 0.8641

ص(X ≤ 160) : binomialcdf (300,0.53,160) = 0.5684

ص(X > 155) : 1 - binomialcdf (300,0.53,155) = 0.6576

ص(X < 147) : binomialcdf (300,0.53,146) = 0.0742

ص(X = 175) :(You use the binomial pdf.) binomialpdf (300,0.53,175) = 0.0083

Try it

In a city, 46 percent of the population favor the incumbent, Dawn Morgan, for mayor. A simple random sample of 500 is taken. Using the continuity correction factor, find the probability that at least 250 favor Dawn Morgan for mayor.


شاهد الفيديو: نظرية النهايه المركزيه الحادى عشر (ديسمبر 2021).