قضیه حد مرکزی (CLT) + تعریف و ویژگی های کلیدی

قضیه حد مرکزی (CLT) + تعریف و ویژگی های کلیدی
توسط منتشر شده در : جولای 9, 2023دسته بندی: مقالات تحلیل آماریLast Updated: جولای 9, 2023بدون دیدگاه on قضیه حد مرکزی (CLT) + تعریف و ویژگی های کلیدینمایش: 1506

چکیده مقاله :
قضیه حد مرکزی یک قضیه مهم در آمار و احتمالات است. این قضیه می‌گوید که وقتی نمونه‌های تصادفی بزرگی از یک مجموعه مستقل و همتوزی گرفته شود، توزیع میانگین نمونه‌ها به توزیع نرمال نزدیک می‌شود. به عبارت دیگر، هر چه تعداد نمونه‌ها بیشتر شود، توزیع میانگین نمونه‌ها به توزیع نرمال نزدیک‌تر می‌شود. این قضیه بسیار کاربردی است. به عنوان مثال، با استفاده از آن می‌توانیم توزیع میانگین یک جامعه را براساس نمونه‌های تصادفی کوچکتری که از آن گرفته می‌شود تخمین بزنیم. همچنین، قضیه حد مرکزی در آزمون فرضیه و ساخت بازه‌های اطمینان نیز استفاده می‌شود. در کل، قضیه حد مرکزی می‌گوید که میانگین نمونه‌های تصادفی به توزیع نرمال همگرا می‌شود و این امر در بسیاری از تجربیات و مسائل آماری به ما کمک می‌کند که در این محتوا می خواهیم به آن بپردازیم.

1- قضیه حد مرکزی (CLT) چیست؟

در تئوری احتمال، قضیه حد مرکزی (CLT) بیان می‌کند که توزیع یک متغیر نمونه تقریباً به یک توزیع نرمال (یعنی “منحنی زنگ”) با بزرگ‌تر شدن اندازه نمونه، با فرض اینکه همه نمونه‌ها از نظر اندازه یکسان هستند و صرف نظر از شکل توزیع واقعی جمعیت، یکسان است.

به عبارت دیگر، CLT یک فرض آماری است که با توجه به حجم نمونه به اندازه کافی بزرگ از یک جامعه با سطح واریانس محدود، میانگین همه متغیرهای نمونه از همان جامعه تقریباً برابر با میانگین کل جامعه خواهد بود. علاوه بر این، این نمونه‌ها تقریباً یک توزیع نرمال دارند، و واریانس‌های آنها تقریباً برابر با واریانس جامعه است که اندازه نمونه بزرگ‌تر می‌شود، طبق قانون اعداد بزرگ.

اگرچه این مفهوم برای اولین بار توسط آبراهام دو مویور در سال 1733 توسعه یافت، اما تا سال 1920، زمانی که ریاضیدان مشهور مجارستانی جورج پولیا آن را قضیه حد مرکزی نامید، رسمیت یافت.

مفاهیم کلیدی

  • قضیه حد مرکزی (CLT) بیان می‌کند که توزیع میانگین‌های نمونه با بزرگ‌تر شدن اندازه نمونه، بدون توجه به توزیع جامعه، به یک توزیع نرمال تقریب می‌زند.
  • اندازه نمونه مساوی یا بیشتر از 30 اغلب برای نگهداری CLT کافی در نظر گرفته می شود.
  • یکی از جنبه های کلیدی CLT این است که میانگین نمونه و انحراف معیار با میانگین جامعه و انحراف معیار برابر است.
  • حجم نمونه به اندازه کافی بزرگ می تواند ویژگی های یک جامعه را با دقت بیشتری پیش بینی کند.
  • CLT هنگام تجزیه و تحلیل مجموعه بزرگی از اوراق بهادار برای تخمین توزیع پرتفوی و ویژگی های بازده، ریسک و همبستگی در امور مالی مفید است.

جهت آشنایی بیشتر می توانید مقاله زیر را با عنوان تحلیل آماری چیست مطالعه نمایید.

2- تعریف قضیه حد مرکزی (CLT)

با توجه به قضیه حد مرکزی، با افزایش حجم نمونه، علی‌رغم توزیع واقعی داده‌ها، میانگین یک نمونه از داده‌ها به میانگین کل جامعه مورد نظر نزدیک‌تر خواهد بود. به عبارت دیگر، داده ها دقیق هستند، چه توزیع نرمال یا نابجا باشد.

به عنوان یک قاعده کلی، اندازه های نمونه حدود 30-50 برای نگهداری CLT کافی تلقی می شود، به این معنی که توزیع میانگین نمونه به طور نسبتاً عادی توزیع شده است. بنابراین، هر چه تعداد نمونه های بیشتری گرفته شود، نتایج نمودار شده بیشتر شکل توزیع نرمال را به خود می گیرند. با این حال، توجه داشته باشید که قضیه حد مرکزی همچنان در بسیاری از موارد برای اندازه‌های نمونه بسیار کوچک‌تر، مانند n=8 یا n=5.3 تقریب خواهد بود.

CLT اغلب در رابطه با قانون اعداد بزرگ استفاده می شود، که بیان می کند که میانگین نمونه و انحراف معیار با افزایش حجم نمونه به برابری با میانگین جامعه و انحراف معیار نزدیک می شود، که در پیش بینی دقیق ویژگی های جمعیت بسیار مفید است.

3- مولفه های کلیدی قضیه حد مرکزی

قضیه حد مرکزی از چندین ویژگی کلیدی تشکیل شده است. این ویژگی ها تا حد زیادی حول نمونه ها، اندازه نمونه و جمعیت داده ها می چرخد.

  • نمونه برداری متوالی است. این بدان معناست که برخی از واحدهای نمونه با واحدهای نمونه انتخاب شده در موارد قبلی مشترک هستند.
  • نمونه گیری تصادفی است. تمامی نمونه ها باید به صورت تصادفی انتخاب شوند تا از نظر آماری یکسانی برای انتخاب داشته باشند.
  • نمونه ها باید مستقل باشند. انتخاب ها یا نتایج یک نمونه نباید تاثیری بر نمونه های آینده یا سایر نتایج نمونه داشته باشد.
  • نمونه ها باید محدود باشد. اغلب ذکر می شود که اگر نمونه برداری بدون جایگزینی انجام شود، یک نمونه نباید بیش از 10٪ از جامعه باشد. به طور کلی، اندازه جمعیت بزرگتر استفاده از حجم نمونه بزرگتر را تضمین می کند.
  • حجم نمونه در حال افزایش. قضیه حد مرکزی با انتخاب نمونه های بیشتر مرتبط است.

4- قضیه حد مرکزی در امور مالی

CLT هنگام بررسی بازده یک سهم یا شاخص های گسترده تر مفید است، زیرا تجزیه و تحلیل ساده است، زیرا به دلیل سهولت نسبی تولید داده های مالی لازم است. در نتیجه، سرمایه‌گذاران از هر نوع برای تجزیه و تحلیل بازده سهام، ساخت پرتفوی و مدیریت ریسک به CLT تکیه می‌کنند.

مثلاً یک سرمایه‌گذار می‌خواهد بازده کلی یک شاخص سهام را که شامل 1000 سهام است، تجزیه و تحلیل کند. در این سناریو، آن سرمایه گذار ممکن است به سادگی یک نمونه تصادفی از سهام را مطالعه کند تا بازده تخمینی شاخص کل را بدست آورد. برای ایمن بودن، حداقل 30 تا 50 سهام انتخاب شده به طور تصادفی در بخش های مختلف باید برای نگهداری قضیه حد مرکزی نمونه برداری شود. علاوه بر این، سهام های انتخاب شده قبلی باید با نام های مختلف مبادله شوند تا به حذف سوگیری کمک کنند.

5- سوالات پرتکرار

چرا قضیه حد مرکزی مفید است؟

CLT هنگام تجزیه و تحلیل مجموعه داده های بزرگ مفید است زیرا به فرد اجازه می دهد فرض کنیم که توزیع نمونه میانگین در اکثر موارد به طور معمول توزیع می شود. این امکان تجزیه و تحلیل آماری و استنتاج آسان تر را فراهم می کند. برای مثال، سرمایه‌گذاران می‌توانند از قضیه حد مرکزی برای جمع‌آوری داده‌های عملکرد امنیتی فردی و تولید توزیع نمونه‌هایی استفاده کنند که نشان‌دهنده توزیع جمعیت بزرگ‌تری برای بازده امنیتی در یک دوره زمانی است.

چرا حداقل اندازه نمونه CLT برابر با 30 است؟

حجم نمونه 30 نفری در بین آمارها نسبتاً رایج است. حجم نمونه 30 عددی اغلب فاصله اطمینان مجموعه داده‌های جمعیت شما را به اندازه‌ای افزایش می‌دهد که ادعاهای خلاف یافته‌های شما را تضمین کند.

فرمول قضیه حد مرکزی چیست؟

CLT فرمول خاص خود را ندارد، اما بر میانگین نمونه و انحراف معیار تکیه دارد. همانطور که میانگین نمونه از جامعه جمع آوری می شود، انحراف معیار برای توزیع داده ها در یک منحنی توزیع احتمال استفاده می شود.

اشتراک گذاری این محتوا، پلتفرم خود را انتخاب کنید!
مطالب مرتبط دیگر :

  • رگرسیون لجستیک (logistic regression) چیست؟
رگرسیون لجستیک (logistic regression) چیست؟

اکتبر 4, 2024|بدون دیدگاه

چکیده مقاله:رگرسیون لجستیک احتمال وقوع یک رویداد، مانند رای دادن یا رای ندادن، را بر اساس یک مجموعه داده از متغیرهای مستقل تخمین می‌زند. این نوع مدل آماری (که به آن مدل لاجیت نیز گفته [...]

  • الگوریتم خفاش (Bat Algorithm) چیست؟
الگوریتم خفاش (Bat Algorithm) چیست؟

اکتبر 3, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم خفاش (Bat Algorithm) یک الگوریتم فراابتکاری مبتنی بر جمعیت است که برای حل مسائل بهینه سازی پیوسته استفاده می شود. این الگوریتم برای بهینه سازی راه حل ها در رایانش ابری، [...]

  • الگوریتم کرم شب تاب چیست؟
الگوریتم کرم شب تاب چیست؟

اکتبر 3, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم کرم شب تاب چیست؟ الگوریتم های الهام گرفته از زیست، که به عنوان الگوریتم های الهام گرفته از طبیعت یا الگوریتم های تکاملی نیز شناخته می شوند، تکنیک های محاسباتی هستند [...]

  • آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال
آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال

سپتامبر 30, 2024|بدون دیدگاه

چکیده مقاله: آزمون فریدمن ابزاری آماری برای مقایسه نمونه‌ها یا اندازه‌گیری‌های مکرر است زمانی که مفروضات پارامتریک برآورده نمی‌شوند. در واقع آزمون فریدمن توسعه‌ای از آزمون Wilcoxon signed-rank test و آنالوگ ناپارامتری از اندازه‌گیری [...]

  • برنامه نویسی فرانت اند: راهنمای جامع توسعه فرانت اند
برنامه نویسی فرانت اند: راهنمای جامع توسعه فرانت اند

سپتامبر 27, 2024|بدون دیدگاه

چکیده مقاله: اگر بخواهیم فرانت اند (Front-end) یا با اسم های دیگر سمت مشتری یا سمت کاربر را توضیح دهیم بهتر است بدانید که توسعه دهنده فرانت اند (Front-End Developer) به کمک زبان های برنامه [...]

  • برنامه نویسی تحت وب چیست؟ انواع، کاربرد و عملکرد
برنامه نویسی تحت وب چیست؟ انواع، کاربرد و عملکرد

سپتامبر 24, 2024|بدون دیدگاه

چکیده مقاله: امروزه تصور جهانی بدون اینترنت و وب سایت‌ها تقریباً غیرممکن است. در سال‌های اخیر، تقاضا برای برنامه نویسان وب حرفه‌ای به طور چشمگیری افزایش یافته است، بنابراین می توانید انواع کارشناسان این [...]