قضیه حد مرکزی (CLT) + تعریف و ویژگی های کلیدی

قضیه حد مرکزی (CLT) + تعریف و ویژگی های کلیدی
توسط منتشر شده در : جولای 9, 2023دسته بندی: مقالات تحلیل آماریLast Updated: جولای 9, 2023بدون دیدگاه on قضیه حد مرکزی (CLT) + تعریف و ویژگی های کلیدینمایش: 1790

چکیده مقاله :
قضیه حد مرکزی یک قضیه مهم در آمار و احتمالات است. این قضیه می‌گوید که وقتی نمونه‌های تصادفی بزرگی از یک مجموعه مستقل و همتوزی گرفته شود، توزیع میانگین نمونه‌ها به توزیع نرمال نزدیک می‌شود. به عبارت دیگر، هر چه تعداد نمونه‌ها بیشتر شود، توزیع میانگین نمونه‌ها به توزیع نرمال نزدیک‌تر می‌شود. این قضیه بسیار کاربردی است. به عنوان مثال، با استفاده از آن می‌توانیم توزیع میانگین یک جامعه را براساس نمونه‌های تصادفی کوچکتری که از آن گرفته می‌شود تخمین بزنیم. همچنین، قضیه حد مرکزی در آزمون فرضیه و ساخت بازه‌های اطمینان نیز استفاده می‌شود. در کل، قضیه حد مرکزی می‌گوید که میانگین نمونه‌های تصادفی به توزیع نرمال همگرا می‌شود و این امر در بسیاری از تجربیات و مسائل آماری به ما کمک می‌کند که در این محتوا می خواهیم به آن بپردازیم.

1- قضیه حد مرکزی (CLT) چیست؟

در تئوری احتمال، قضیه حد مرکزی (CLT) بیان می‌کند که توزیع یک متغیر نمونه تقریباً به یک توزیع نرمال (یعنی “منحنی زنگ”) با بزرگ‌تر شدن اندازه نمونه، با فرض اینکه همه نمونه‌ها از نظر اندازه یکسان هستند و صرف نظر از شکل توزیع واقعی جمعیت، یکسان است.

به عبارت دیگر، CLT یک فرض آماری است که با توجه به حجم نمونه به اندازه کافی بزرگ از یک جامعه با سطح واریانس محدود، میانگین همه متغیرهای نمونه از همان جامعه تقریباً برابر با میانگین کل جامعه خواهد بود. علاوه بر این، این نمونه‌ها تقریباً یک توزیع نرمال دارند، و واریانس‌های آنها تقریباً برابر با واریانس جامعه است که اندازه نمونه بزرگ‌تر می‌شود، طبق قانون اعداد بزرگ.

اگرچه این مفهوم برای اولین بار توسط آبراهام دو مویور در سال 1733 توسعه یافت، اما تا سال 1920، زمانی که ریاضیدان مشهور مجارستانی جورج پولیا آن را قضیه حد مرکزی نامید، رسمیت یافت.

مفاهیم کلیدی

  • قضیه حد مرکزی (CLT) بیان می‌کند که توزیع میانگین‌های نمونه با بزرگ‌تر شدن اندازه نمونه، بدون توجه به توزیع جامعه، به یک توزیع نرمال تقریب می‌زند.
  • اندازه نمونه مساوی یا بیشتر از 30 اغلب برای نگهداری CLT کافی در نظر گرفته می شود.
  • یکی از جنبه های کلیدی CLT این است که میانگین نمونه و انحراف معیار با میانگین جامعه و انحراف معیار برابر است.
  • حجم نمونه به اندازه کافی بزرگ می تواند ویژگی های یک جامعه را با دقت بیشتری پیش بینی کند.
  • CLT هنگام تجزیه و تحلیل مجموعه بزرگی از اوراق بهادار برای تخمین توزیع پرتفوی و ویژگی های بازده، ریسک و همبستگی در امور مالی مفید است.

جهت آشنایی بیشتر می توانید مقاله زیر را با عنوان تحلیل آماری چیست مطالعه نمایید.

2- تعریف قضیه حد مرکزی (CLT)

با توجه به قضیه حد مرکزی، با افزایش حجم نمونه، علی‌رغم توزیع واقعی داده‌ها، میانگین یک نمونه از داده‌ها به میانگین کل جامعه مورد نظر نزدیک‌تر خواهد بود. به عبارت دیگر، داده ها دقیق هستند، چه توزیع نرمال یا نابجا باشد.

به عنوان یک قاعده کلی، اندازه های نمونه حدود 30-50 برای نگهداری CLT کافی تلقی می شود، به این معنی که توزیع میانگین نمونه به طور نسبتاً عادی توزیع شده است. بنابراین، هر چه تعداد نمونه های بیشتری گرفته شود، نتایج نمودار شده بیشتر شکل توزیع نرمال را به خود می گیرند. با این حال، توجه داشته باشید که قضیه حد مرکزی همچنان در بسیاری از موارد برای اندازه‌های نمونه بسیار کوچک‌تر، مانند n=8 یا n=5.3 تقریب خواهد بود.

CLT اغلب در رابطه با قانون اعداد بزرگ استفاده می شود، که بیان می کند که میانگین نمونه و انحراف معیار با افزایش حجم نمونه به برابری با میانگین جامعه و انحراف معیار نزدیک می شود، که در پیش بینی دقیق ویژگی های جمعیت بسیار مفید است.

3- مولفه های کلیدی قضیه حد مرکزی

قضیه حد مرکزی از چندین ویژگی کلیدی تشکیل شده است. این ویژگی ها تا حد زیادی حول نمونه ها، اندازه نمونه و جمعیت داده ها می چرخد.

  • نمونه برداری متوالی است. این بدان معناست که برخی از واحدهای نمونه با واحدهای نمونه انتخاب شده در موارد قبلی مشترک هستند.
  • نمونه گیری تصادفی است. تمامی نمونه ها باید به صورت تصادفی انتخاب شوند تا از نظر آماری یکسانی برای انتخاب داشته باشند.
  • نمونه ها باید مستقل باشند. انتخاب ها یا نتایج یک نمونه نباید تاثیری بر نمونه های آینده یا سایر نتایج نمونه داشته باشد.
  • نمونه ها باید محدود باشد. اغلب ذکر می شود که اگر نمونه برداری بدون جایگزینی انجام شود، یک نمونه نباید بیش از 10٪ از جامعه باشد. به طور کلی، اندازه جمعیت بزرگتر استفاده از حجم نمونه بزرگتر را تضمین می کند.
  • حجم نمونه در حال افزایش. قضیه حد مرکزی با انتخاب نمونه های بیشتر مرتبط است.

4- قضیه حد مرکزی در امور مالی

CLT هنگام بررسی بازده یک سهم یا شاخص های گسترده تر مفید است، زیرا تجزیه و تحلیل ساده است، زیرا به دلیل سهولت نسبی تولید داده های مالی لازم است. در نتیجه، سرمایه‌گذاران از هر نوع برای تجزیه و تحلیل بازده سهام، ساخت پرتفوی و مدیریت ریسک به CLT تکیه می‌کنند.

مثلاً یک سرمایه‌گذار می‌خواهد بازده کلی یک شاخص سهام را که شامل 1000 سهام است، تجزیه و تحلیل کند. در این سناریو، آن سرمایه گذار ممکن است به سادگی یک نمونه تصادفی از سهام را مطالعه کند تا بازده تخمینی شاخص کل را بدست آورد. برای ایمن بودن، حداقل 30 تا 50 سهام انتخاب شده به طور تصادفی در بخش های مختلف باید برای نگهداری قضیه حد مرکزی نمونه برداری شود. علاوه بر این، سهام های انتخاب شده قبلی باید با نام های مختلف مبادله شوند تا به حذف سوگیری کمک کنند.

5- سوالات پرتکرار

چرا قضیه حد مرکزی مفید است؟

CLT هنگام تجزیه و تحلیل مجموعه داده های بزرگ مفید است زیرا به فرد اجازه می دهد فرض کنیم که توزیع نمونه میانگین در اکثر موارد به طور معمول توزیع می شود. این امکان تجزیه و تحلیل آماری و استنتاج آسان تر را فراهم می کند. برای مثال، سرمایه‌گذاران می‌توانند از قضیه حد مرکزی برای جمع‌آوری داده‌های عملکرد امنیتی فردی و تولید توزیع نمونه‌هایی استفاده کنند که نشان‌دهنده توزیع جمعیت بزرگ‌تری برای بازده امنیتی در یک دوره زمانی است.

چرا حداقل اندازه نمونه CLT برابر با 30 است؟

حجم نمونه 30 نفری در بین آمارها نسبتاً رایج است. حجم نمونه 30 عددی اغلب فاصله اطمینان مجموعه داده‌های جمعیت شما را به اندازه‌ای افزایش می‌دهد که ادعاهای خلاف یافته‌های شما را تضمین کند.

فرمول قضیه حد مرکزی چیست؟

CLT فرمول خاص خود را ندارد، اما بر میانگین نمونه و انحراف معیار تکیه دارد. همانطور که میانگین نمونه از جامعه جمع آوری می شود، انحراف معیار برای توزیع داده ها در یک منحنی توزیع احتمال استفاده می شود.

اشتراک گذاری این محتوا، پلتفرم خود را انتخاب کنید!
مطالب مرتبط دیگر :

  • الگوریتم تکاملی تفاضلی: پیاده سازی، مزایا و کاربرد
الگوریتم تکاملی تفاضلی: پیاده سازی، مزایا و کاربرد

دسامبر 1, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم تکاملی تفاضلی (Differential Evolution Algorithm) یکی از الگوریتم های بهینه سازی مبتنی بر جمعیت است که در حل مسائل پیچیده و غیرخطی بسیار کارآمد می باشد. این الگوریتم با الهام از [...]

  • فیلتر هودریک پرسکات (HP) چیست؟ راهنمای کامل
فیلتر هودریک پرسکات (HP) چیست؟ راهنمای کامل

نوامبر 26, 2024|بدون دیدگاه

چکیده مقاله: فیلتر هودریک پرسکات (Hodrick-Prescott Filter) یک ابزار آماری و اقتصادی است که برای جداسازی روند بلندمدت از نوسانات کوتاه مدت در داده های سری زمانی به کار می رود. این فیلتر، به [...]

  • مربیان سئو (SEO Mentors): 11 متخصص که باید در سال 2024 دنبال کنید
مربیان سئو (SEO Mentors): 11 متخصص که باید در سال 2024 دنبال کنید

نوامبر 10, 2024|بدون دیدگاه

چکیده مقاله: قبل از معرفی بهترین مربیان و متخصصان سئو بهتر است بدانید که سئو آسان نیست. موارد زیادی برای پیگیری وجود دارد و گوگل با هر به روزرسانی هدف گذاری های جدیدی تعیین [...]

  • سئو برای افیلیت مارکتینگ: فروش بیشتر در سیستم همکاری در فروش
سئو برای افیلیت مارکتینگ: فروش بیشتر در سیستم همکاری در فروش

نوامبر 9, 2024|بدون دیدگاه

مقدمه: افیلیت مارکتینگ (Affiliate Marketing) یا همکاری در فروش یک استراتژی است که در آن شما محصولات یا خدمات را تبلیغ می کنید و به ازای هر فروش یا لید (مشتری بالقوه) که ایجاد [...]