قضیه حد مرکزی (CLT) + تعریف و ویژگی های کلیدی
چکیده مقاله :
قضیه حد مرکزی یک قضیه مهم در آمار و احتمالات است. این قضیه میگوید که وقتی نمونههای تصادفی بزرگی از یک مجموعه مستقل و همتوزی گرفته شود، توزیع میانگین نمونهها به توزیع نرمال نزدیک میشود. به عبارت دیگر، هر چه تعداد نمونهها بیشتر شود، توزیع میانگین نمونهها به توزیع نرمال نزدیکتر میشود. این قضیه بسیار کاربردی است. به عنوان مثال، با استفاده از آن میتوانیم توزیع میانگین یک جامعه را براساس نمونههای تصادفی کوچکتری که از آن گرفته میشود تخمین بزنیم. همچنین، قضیه حد مرکزی در آزمون فرضیه و ساخت بازههای اطمینان نیز استفاده میشود. در کل، قضیه حد مرکزی میگوید که میانگین نمونههای تصادفی به توزیع نرمال همگرا میشود و این امر در بسیاری از تجربیات و مسائل آماری به ما کمک میکند که در این محتوا می خواهیم به آن بپردازیم.
1- قضیه حد مرکزی (CLT) چیست؟
در تئوری احتمال، قضیه حد مرکزی (CLT) بیان میکند که توزیع یک متغیر نمونه تقریباً به یک توزیع نرمال (یعنی “منحنی زنگ”) با بزرگتر شدن اندازه نمونه، با فرض اینکه همه نمونهها از نظر اندازه یکسان هستند و صرف نظر از شکل توزیع واقعی جمعیت، یکسان است.
به عبارت دیگر، CLT یک فرض آماری است که با توجه به حجم نمونه به اندازه کافی بزرگ از یک جامعه با سطح واریانس محدود، میانگین همه متغیرهای نمونه از همان جامعه تقریباً برابر با میانگین کل جامعه خواهد بود. علاوه بر این، این نمونهها تقریباً یک توزیع نرمال دارند، و واریانسهای آنها تقریباً برابر با واریانس جامعه است که اندازه نمونه بزرگتر میشود، طبق قانون اعداد بزرگ.
اگرچه این مفهوم برای اولین بار توسط آبراهام دو مویور در سال 1733 توسعه یافت، اما تا سال 1920، زمانی که ریاضیدان مشهور مجارستانی جورج پولیا آن را قضیه حد مرکزی نامید، رسمیت یافت.
مفاهیم کلیدی
- قضیه حد مرکزی (CLT) بیان میکند که توزیع میانگینهای نمونه با بزرگتر شدن اندازه نمونه، بدون توجه به توزیع جامعه، به یک توزیع نرمال تقریب میزند.
- اندازه نمونه مساوی یا بیشتر از 30 اغلب برای نگهداری CLT کافی در نظر گرفته می شود.
- یکی از جنبه های کلیدی CLT این است که میانگین نمونه و انحراف معیار با میانگین جامعه و انحراف معیار برابر است.
- حجم نمونه به اندازه کافی بزرگ می تواند ویژگی های یک جامعه را با دقت بیشتری پیش بینی کند.
- CLT هنگام تجزیه و تحلیل مجموعه بزرگی از اوراق بهادار برای تخمین توزیع پرتفوی و ویژگی های بازده، ریسک و همبستگی در امور مالی مفید است.
جهت آشنایی بیشتر می توانید مقاله زیر را با عنوان تحلیل آماری چیست مطالعه نمایید.
2- تعریف قضیه حد مرکزی (CLT)
با توجه به قضیه حد مرکزی، با افزایش حجم نمونه، علیرغم توزیع واقعی دادهها، میانگین یک نمونه از دادهها به میانگین کل جامعه مورد نظر نزدیکتر خواهد بود. به عبارت دیگر، داده ها دقیق هستند، چه توزیع نرمال یا نابجا باشد.
به عنوان یک قاعده کلی، اندازه های نمونه حدود 30-50 برای نگهداری CLT کافی تلقی می شود، به این معنی که توزیع میانگین نمونه به طور نسبتاً عادی توزیع شده است. بنابراین، هر چه تعداد نمونه های بیشتری گرفته شود، نتایج نمودار شده بیشتر شکل توزیع نرمال را به خود می گیرند. با این حال، توجه داشته باشید که قضیه حد مرکزی همچنان در بسیاری از موارد برای اندازههای نمونه بسیار کوچکتر، مانند n=8 یا n=5.3 تقریب خواهد بود.
CLT اغلب در رابطه با قانون اعداد بزرگ استفاده می شود، که بیان می کند که میانگین نمونه و انحراف معیار با افزایش حجم نمونه به برابری با میانگین جامعه و انحراف معیار نزدیک می شود، که در پیش بینی دقیق ویژگی های جمعیت بسیار مفید است.
3- مولفه های کلیدی قضیه حد مرکزی
قضیه حد مرکزی از چندین ویژگی کلیدی تشکیل شده است. این ویژگی ها تا حد زیادی حول نمونه ها، اندازه نمونه و جمعیت داده ها می چرخد.
- نمونه برداری متوالی است. این بدان معناست که برخی از واحدهای نمونه با واحدهای نمونه انتخاب شده در موارد قبلی مشترک هستند.
- نمونه گیری تصادفی است. تمامی نمونه ها باید به صورت تصادفی انتخاب شوند تا از نظر آماری یکسانی برای انتخاب داشته باشند.
- نمونه ها باید مستقل باشند. انتخاب ها یا نتایج یک نمونه نباید تاثیری بر نمونه های آینده یا سایر نتایج نمونه داشته باشد.
- نمونه ها باید محدود باشد. اغلب ذکر می شود که اگر نمونه برداری بدون جایگزینی انجام شود، یک نمونه نباید بیش از 10٪ از جامعه باشد. به طور کلی، اندازه جمعیت بزرگتر استفاده از حجم نمونه بزرگتر را تضمین می کند.
- حجم نمونه در حال افزایش. قضیه حد مرکزی با انتخاب نمونه های بیشتر مرتبط است.
4- قضیه حد مرکزی در امور مالی
CLT هنگام بررسی بازده یک سهم یا شاخص های گسترده تر مفید است، زیرا تجزیه و تحلیل ساده است، زیرا به دلیل سهولت نسبی تولید داده های مالی لازم است. در نتیجه، سرمایهگذاران از هر نوع برای تجزیه و تحلیل بازده سهام، ساخت پرتفوی و مدیریت ریسک به CLT تکیه میکنند.
مثلاً یک سرمایهگذار میخواهد بازده کلی یک شاخص سهام را که شامل 1000 سهام است، تجزیه و تحلیل کند. در این سناریو، آن سرمایه گذار ممکن است به سادگی یک نمونه تصادفی از سهام را مطالعه کند تا بازده تخمینی شاخص کل را بدست آورد. برای ایمن بودن، حداقل 30 تا 50 سهام انتخاب شده به طور تصادفی در بخش های مختلف باید برای نگهداری قضیه حد مرکزی نمونه برداری شود. علاوه بر این، سهام های انتخاب شده قبلی باید با نام های مختلف مبادله شوند تا به حذف سوگیری کمک کنند.
5- سوالات پرتکرار
چرا قضیه حد مرکزی مفید است؟
CLT هنگام تجزیه و تحلیل مجموعه داده های بزرگ مفید است زیرا به فرد اجازه می دهد فرض کنیم که توزیع نمونه میانگین در اکثر موارد به طور معمول توزیع می شود. این امکان تجزیه و تحلیل آماری و استنتاج آسان تر را فراهم می کند. برای مثال، سرمایهگذاران میتوانند از قضیه حد مرکزی برای جمعآوری دادههای عملکرد امنیتی فردی و تولید توزیع نمونههایی استفاده کنند که نشاندهنده توزیع جمعیت بزرگتری برای بازده امنیتی در یک دوره زمانی است.
چرا حداقل اندازه نمونه CLT برابر با 30 است؟
حجم نمونه 30 نفری در بین آمارها نسبتاً رایج است. حجم نمونه 30 عددی اغلب فاصله اطمینان مجموعه دادههای جمعیت شما را به اندازهای افزایش میدهد که ادعاهای خلاف یافتههای شما را تضمین کند.
فرمول قضیه حد مرکزی چیست؟
CLT فرمول خاص خود را ندارد، اما بر میانگین نمونه و انحراف معیار تکیه دارد. همانطور که میانگین نمونه از جامعه جمع آوری می شود، انحراف معیار برای توزیع داده ها در یک منحنی توزیع احتمال استفاده می شود.
مدیر2024-12-01T18:49:34+03:30دسامبر 1, 2024|بدون دیدگاه
چکیده مقاله: الگوریتم تکاملی تفاضلی (Differential Evolution Algorithm) یکی از الگوریتم های بهینه سازی مبتنی بر جمعیت است که در حل مسائل پیچیده و غیرخطی بسیار کارآمد می باشد. این الگوریتم با الهام از [...]
مدیر2024-11-28T14:59:42+03:30نوامبر 28, 2024|بدون دیدگاه
چکیده مقاله: MATLAB یک محیط محاسبات عددی تجاری و یک زبان برنامه نویسی می باشد که یکی از ساده ترین و کارآمدترین محیط ها برای مهندسان و دانشمندان است و به طور کامل به [...]
مدیر2024-11-26T18:14:43+03:30نوامبر 26, 2024|بدون دیدگاه
چکیده مقاله: فیلتر هودریک پرسکات (Hodrick-Prescott Filter) یک ابزار آماری و اقتصادی است که برای جداسازی روند بلندمدت از نوسانات کوتاه مدت در داده های سری زمانی به کار می رود. این فیلتر، به [...]
مدیر2024-11-10T19:36:22+03:30نوامبر 10, 2024|بدون دیدگاه
چکیده مقاله: توزیع محتوا (Content Syndication) می تواند به شما کمک کند تا محتوای بیشتری در معرض دید مخاطبان قرار بگیرد. شما می توانید محتوای وبلاگ خود را در چندین وبسایت و پلتفرم مجددا [...]
مدیر2024-11-10T18:43:37+03:30نوامبر 10, 2024|بدون دیدگاه
چکیده مقاله: قبل از معرفی بهترین مربیان و متخصصان سئو بهتر است بدانید که سئو آسان نیست. موارد زیادی برای پیگیری وجود دارد و گوگل با هر به روزرسانی هدف گذاری های جدیدی تعیین [...]
مدیر2024-11-09T00:42:39+03:30نوامبر 9, 2024|بدون دیدگاه
مقدمه: افیلیت مارکتینگ (Affiliate Marketing) یا همکاری در فروش یک استراتژی است که در آن شما محصولات یا خدمات را تبلیغ می کنید و به ازای هر فروش یا لید (مشتری بالقوه) که ایجاد [...]