تست Wilcoxon + تعریف در آمار، انواع و محاسبه
چکیده مقاله :
تست Wilcoxon (آزمون رتبهبندی علامت دار ویلکاکسون) آزمایش میکند که آیا میانگین مقادیر دو گروه وابسته به طور قابل توجهی با یکدیگر متفاوت است یا خیر. آزمون Wilcoxon یک آزمون ناپارامتریک است و بنابراین در معرض فرضیات بسیار کمتری نسبت به همتای پارامتری خود، آزمون t برای نمونههای وابسته است. بنابراین، به محض اینکه شرایط مرزی برای آزمون t برای نمونههای وابسته دیگر برآورده نشد، از آزمون Wilcoxon استفاده میشود. در این مقاله به بررسی کامل آن می پردازیم.
1- تست ویلکاکسون چیست؟
آزمون Wilcoxon که می تواند به آزمون مجموع رتبه یا نسخه آزمون رتبه امضا شده اشاره کند، یک آزمون آماری ناپارامتریک است که دو گروه زوجی را با هم مقایسه می کند. این آزمونها اساساً تفاوت بین مجموعههای جفت را محاسبه میکنند و این تفاوتها را تجزیه و تحلیل میکنند تا مشخص شود که آیا از نظر آماری تفاوت معنیداری با یکدیگر دارند یا خیر.
مفاهیم کلیدی
- آزمون Wilcoxon دو گروه زوجی را با هم مقایسه می کند و در دو نسخه ارائه می شود، آزمون مجموع رتبه و آزمون رتبه امضا شده.
- هدف این آزمون تعیین این است که آیا دو یا چند مجموعه از جفت ها از نظر آماری با یکدیگر متفاوت هستند یا خیر.
- هر دو نسخه مدل فرض میکنند که جفتهای موجود در دادهها از جمعیتهای وابسته به دست میآیند، یعنی دنبال کردن یک فرد یا قیمت سهام در طول زمان یا مکان.
جهت آشنایی بیشتر می توانید مقاله زیر را با عنوان تحلیل آماری چیست مطالعه نمایید.
2- تعریف تست ویلکاکسون
مجموع رتبه و آزمون رتبه امضا شده هر دو توسط آماردان آمریکایی فرانک ویلکاکسون در یک مقاله تحقیقاتی پیشگامانه که در سال 1945 منتشر شد پیشنهاد شد.
این آزمونها پایه و اساس آزمون فرضیههای آمار ناپارامتریک را ایجاد کردند، که برای دادههای جمعیتی که میتوانند رتبهبندی شوند اما مقادیر عددی ندارند، مانند رضایت مشتری یا بررسی موسیقی، استفاده میشوند. توزیع های ناپارامتریک پارامتری ندارند و نمی توانند با یک معادله تعریف شوند، اما توزیع های پارامتریک می توانند.
انواع سوالاتی که تست Wilcoxon می تواند به آنها کمک کند شامل موارد زیر است:
- آیا نمرات آزمون از کلاس پنجم تا ششم برای دانش آموزان یکسان متفاوت است؟
- آیا زمانی که یک داروی خاص روی همان افراد آزمایش می شود تأثیری بر سلامتی دارد؟
این مدلها فرض میکنند که دادهها از دو جمعیت همسان یا وابسته به دست میآیند که از یک فرد یا سهام در طول زمان یا مکان پیروی میکنند. همچنین فرض میشود که دادهها در مقابل گسسته، پیوسته هستند. از آنجایی که این یک آزمون ناپارامتریک است، نیازی به توزیع احتمال خاصی از متغیر وابسته در تحلیل ندارد.
3- فرضیات تست Wilcoxon
از آنجایی که تست Wilcoxon یک آزمون ناپارامتریک است، داده ها نیازی به توزیع نرمال ندارند. با این حال، برای محاسبه تست Wilcoxon، نمونه ها باید وابسته باشند. نمونههای وابسته وجود دارند، برای مثال، زمانی که دادهها از اندازهگیریهای مکرر بهدست میآیند یا زمانی که به اصطلاح جفتهای طبیعی درگیر هستند.
- تکرار اندازه گیری: ویژگی یک فرد، به عنوان مثال. وزن، در دو نقطه از زمان اندازه گیری شد
- زوجهای طبیعی: ارزشها لزوماً نباید از یک فرد باشد، بلکه از افرادی باشد که به هم تعلق دارند، برای مثال وکیل/موکل، همسر/شوهر و روانشناس/بیمار. البته لازم نیست آنها هم مردم باشند.
- استقلال: آزمون علامت ویلکاکسون استقلال را فرض می کند، یعنی مشاهدات زوجی به طور تصادفی و مستقل ترسیم می شوند.
علاوه بر این، شکل توزیع تفاوت های دو نمونه وابسته باید تقریباً متقارن باشد. اگر داده ها به صورت جفت در دسترس نباشد، به جای آزمون Wilcoxon از آزمون Mann-Whitney U استفاده می شود.
4- انواع تست ویلکاکسون
- از آزمون جمع رتبهای ویلکاکسون میتوان برای آزمون فرضیه صفر استفاده کرد که دو جمعیت توزیع پیوسته یکسانی دارند. فرضیه صفر یک آزمون آماری است که می گوید بین دو جامعه یا متغیر تفاوت معناداری وجود ندارد. مفروضات پایه لازم برای استفاده از آزمون مجموع رتبه ای این است که داده ها از یک جامعه هستند و جفت هستند، داده ها را می توان حداقل در مقیاس فاصله ای اندازه گیری کرد و داده ها به صورت تصادفی و مستقل انتخاب شدند.
- آزمون رتبه علامت دار Wilcoxon فرض می کند که اطلاعاتی در بزرگی ها و نشانه های تفاوت بین مشاهدات زوجی وجود دارد. به عنوان معادل ناپارامتری آزمون t زوجی دانش آموز، زمانی که داده های جامعه از توزیع نرمال پیروی نمی کنند، رتبه علامت دار می تواند به عنوان جایگزینی برای آزمون t استفاده شود.
5- فرضیه ها در تست ویلکاکسون
فرضیه های تست Wilcoxon شباهت زیادی به فرضیه های آزمون t وابسته دارد. با این حال، در مورد تست ویلکاکسون، آزمون این است که آیا تفاوتی در گرایش مرکزی وجود دارد یا خیر. در مورد آزمون t، آزمون این است که آیا تفاوتی در میانگین وجود دارد یا خیر. بنابراین، آزمون من ویتنی U نتایج زیر را نشان می دهد:
- فرضیه صفر: تفاوتی (از نظر گرایش مرکزی) بین دو گروه در جامعه وجود ندارد.
- فرضیه جایگزین: بین دو گروه در جمعیت (با توجه به گرایش مرکزی) تفاوت وجود دارد.
6- قدرت تست ویلکاکسون
البته ممکن است این سوال پیش بیاید که چرا من همیشه از تست Wilcoxon به جای آزمون t برای نمونه های وابسته استفاده نمی کنم؟ بعد برای توزیع عادی نیازی به تست ندارم! تست های پارامتریک مانند آزمون t معمولا قدرتمندتر هستند!
با آزمون پارامتریک، معمولاً یک تفاوت کوچکتر یا یک نمونه کوچکتر برای رد فرضیه صفر کافی است. البته هر دو بسیار راحت هستند. بنابراین در صورت امکان همیشه از تست های پارامتریک استفاده کنید!
7- محاسبه تست Wilcoxon
مراحل رسیدن به آماره آزمون رتبه امضا شده Wilcoxon، W، به شرح زیر است:
- برای هر آیتم در نمونه ای از n مورد، یک امتیاز تفاوت، Di، بین دو اندازه گیری به دست آورید (یعنی یکی را از دیگری کم کنید).
- سپس علائم مثبت یا منفی را نادیده بگیرید و مجموعه ای از n تفاوت مطلق |Di| را بدست آورید.
- امتیازهای تفاوت صفر را حذف کنید، مجموعه ای از n امتیاز تفاوت مطلق غیر صفر را به شما می دهد، که در آن n’≤ n. بنابراین، n به اندازه نمونه واقعی تبدیل می شود.
- سپس، رتبه های Ri را از 1 تا n به هر یک از |Di| اختصاص دهید به طوری که کوچکترین امتیاز اختلاف مطلق رتبه 1 و بزرگترین امتیاز رتبه n را کسب می کند. اگر دو یا بیشتر از |Di| ها برابر هستند، به هر یک از آنها میانگین رتبههایی اختصاص داده میشود که اگر پیوندهایی در دادهها وجود نداشت، به صورت جداگانه به آنها اختصاص داده میشد.
- حالا نماد “+” یا “-” را به هر یک از n رتبههای Ri اختصاص دهید، بسته به اینکه Di در ابتدا مثبت یا منفی بوده است.
- آماره W آزمون Wilcoxon متعاقباً به عنوان مجموع رتبه های مثبت به دست می آید.
در عمل این آزمون با استفاده از نرم افزار تحلیل آماری یا صفحه گسترده انجام می شود.
برای محاسبه تست Wilcoxon برای دو نمونه وابسته، ابتدا تفاوت بین مقادیر وابسته محاسبه می شود. پس از محاسبه تفاوت ها، از مقادیر مطلق تفاوت ها برای تشکیل رتبه بندی استفاده می شود. توجه به نشانه اصلی تفاوت ها مهم است (نمونه ای با رتبه های متقابل در زیر آمده است).
در مرحله آخر، مجموع رتبه هایی که از اختلاف مثبت و منفی به دست می آید، تشکیل می شود. سپس آمار آزمون W از مقدار کوچکتر T+ و T- محاسبه می شود.
در این مثال، آمار آزمون W به 8 می رسد.
اگر تفاوتی در مجموع رتبه وجود نداشته باشد، مقدار مورد انتظار :
در این مثال، مقدار مورد انتظار 10.5 است. اکنون باید آمار آزمون محاسبه شده برای معناداری مورد آزمایش قرار گیرد.
اگر نمونه به اندازه کافی بزرگ باشد، یعنی تعداد موارد بیشتر از 25 باشد، مقدار بحرانی تقریباً به طور معمول توزیع می شود. اگر توزیع نرمال فرض شود، z-value را می توان با استفاده از فرمول بالا محاسبه کرد. اگر کمتر از 25 مقدار وجود داشته باشد، مقدار T بحرانی از جدول مقادیر T بحرانی خوانده می شود. بنابراین، در این مورد، جدول در واقع استفاده می شود.
اکنون می توان مقدار z محاسبه شده از آزمون Wilcoxon را با مقایسه آن با مقدار بحرانی توزیع نرمال استاندارد از نظر اهمیت بررسی کرد.
جهت کسب اطلاعات بیشتر می توانید از مشاوره آماری لنسرسرا بهره مند شوید.
مدیر2025-01-11T00:57:06+03:30ژانویه 9, 2025|بدون دیدگاه
چکیده مقاله: شبکه عصبی مصنوعی مدلی محاسباتی است که از شبکه نورون های موجود در مغز انسان الهام گرفته شده است. همچنین می توان آن را به عنوان الگوریتم یادگیری در نظر گرفت که [...]
مدیر2025-01-11T00:50:23+03:30ژانویه 9, 2025|بدون دیدگاه
چکیده مقاله: شبکه عصبی مدولار یک ساختار پیشرفته در یادگیری ماشین است که از چندین مدل شبکه عصبی کوچک یا مدولار تشکیل شده است. هر یک از این مدول ها به طور مستقل وظایف [...]
مدیر2025-01-08T23:02:05+03:30ژانویه 8, 2025|بدون دیدگاه
چکیده مقاله: قبل از پرداختن به موضوع شبیه سازی با هوش مصنوعی بهتر است بدانید که هوش مصنوعی یکی از فناوری های نوین و تحول آفرین در عصر حاضر می باشد که توانسته است [...]
مدیر2025-01-06T18:36:57+03:30ژانویه 6, 2025|بدون دیدگاه
چکیده مقاله: بینایی کامپیوتر (computer vision) شاخه ای از علوم کامپیوتر است که بر توانمند کردن کامپیوترها برای شناسایی و درک اشیا و افراد در تصاویر و ویدیوها تمرکز دارد. مانند سایر انواع هوش [...]
مدیر2025-01-04T17:04:30+03:30ژانویه 4, 2025|بدون دیدگاه
چکیده مقاله: قبل از پرداختن به شبکه عصبی پیشخور (Feedforward Neural Network یا FNN) بهتر است بدانید که شبکه های عصبی مصنوعی (Artificial Neural Networks یا ANNs) تحول بزرگی در حوزه یادگیری ماشین ایجاد [...]
مدیر2025-01-04T14:03:08+03:30ژانویه 2, 2025|بدون دیدگاه
چکیده مقاله: شبکه عصبی کانولوشنی (CNN) یک معماری شبکه عصبی عمیق است که به طور گسترده در حوزه بینایی کامپیوتر استفاده می شود. بینایی کامپیوتر شاخه ای از هوش مصنوعی است که به کامپیوترها [...]