آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال

آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال
توسط منتشر شده در : سپتامبر 30, 2024دسته بندی: مقالات تحلیل آماریLast Updated: سپتامبر 30, 2024بدون دیدگاه on آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثالنمایش: 22

چکیده مقاله:
آزمون فریدمن ابزاری آماری برای مقایسه نمونه‌ها یا اندازه‌گیری‌های مکرر است زمانی که مفروضات پارامتریک برآورده نمی‌شوند. در واقع آزمون فریدمن توسعه‌ای از آزمون Wilcoxon signed-rank test و آنالوگ ناپارامتری از اندازه‌گیری های تکراری یک طرفه است. در بسیاری از مواقع لازم است که اندازه‌گیری‌های مکرر یا نمونه‌ها با هم مقایسه شوند، مانند بررسی عملکردهای بیولوژیکی یک فرد در طول زمان یا اندازه‌گیری مکرر غلظت یک ماده شیمیایی در یک کشت سلولی. در چنین شرایطی، ممکن است از آزمون تحلیل واریانس یک‌طرفه (ANOVA) استفاده شود، اما همه مجموعه‌ داده‌ها الزامات پارامتری این آزمون را برآورده نمی‌کنند و نیاز به جایگزینی مناسب وجود دارد. در این مقاله، یکی از این جایگزین‌ها، یعنی آزمون فریدمن، فرضیات آن، زمان استفاده از آن و همچنین مثال عملی از این آزمون را بررسی می‌کنیم.

آزمون فریدمن چیست؟

آزمون فریدمن یک آزمون آماری ناپارامتری است که برای تحلیل داده های اندازه گیری مکرر استفاده می شود. این آزمون زمانی کاربرد دارد که فرضیه های نرمال بودن و همگنی واریانس ها برقرار نباشند، بنابراین به عنوان جایگزینی مناسب و مقاوم برای آزمون تحلیل واریانس با اندازه های مکرر (ANOVA) عمل می کند.

آزمون فریدمن، که گاهی اوقات به آن تحلیل واریانس دو طرفه فریدمن با رتبه‌ها نیز گفته می‌شود، یک آزمون آماری ناپارامتری است که برای بررسی این موضوع استفاده می‌شود که آیا گروه‌های دارای سه یا بیشتر اندازه‌گیری مکرر با یکدیگر تفاوت دارند یا خیر. این آزمون زمانی به کار می‌رود که داده‌های متغیر مورد نظر ترتیبی یا پیوسته باشند. این آزمون ناپارامتری است زیرا هیچگونه فرضی در مورد توزیع داده‌ها (مانند توزیع نرمال) ندارد. در عمل، آزمون فریدمن اغلب زمانی استفاده می‌شود که متغیر پیوسته الزامات لازم برای تحلیل واریانس یک طرفه (ANOVA) را برآورده نکند یا هنگامی که متغیر مورد نظر ترتیبی باشد.

آزمون فریدمن

نمونه وابسته (اندازه گیری مکرر) چیست؟

در یک نمونه وابسته، مقادیر اندازه گیری شده به هم مرتبط هستند. برای مثال، اگر نمونه ای از افرادی که عمل جراحی زانو انجام داده اند انتخاب شود و این افراد قبل از جراحی و یک هفته و دو هفته بعد از جراحی مورد بررسی قرار گیرند، یک نمونه وابسته محسوب می شود. این به این دلیل است که همان افراد در چندین نقطه زمانی مصاحبه شده اند.

مقایسه آزمون فریدمن با آزمون ANOVA با اندازه گیری های مکرر

شاید بپرسید که تحلیل واریانس با اندازه گیری های مکرر دقیقا همین موضوع را بررسی نمی کند، زیرا این آزمون نیز تفاوت بین سه یا چند نمونه وابسته را مورد آزمون قرار می دهد؟
بله، درست است. آزمون فریدمن معادل ناپارامتری تحلیل واریانس با اندازه گیری های مکرر است. اما تفاوت بین این دو آزمون چیست؟
تحلیل واریانس تفاوت بین مقادیر اندازه گیری شده در نمونه های وابسته را بررسی می کند، در حالی که آزمون فریدمن از رتبه ها به جای مقادیر واقعی اندازه گیری شده استفاده می کند.

چگونه رتبه ها محاسبه می شوند؟

در آزمون فریدمن، زمانی که یک فرد در یک نقطه زمانی بالاترین مقدار را دارد، رتبه 1 به آن اختصاص می یابد. نقطه زمانی با دومین مقدار بالاتر رتبه 2 و نقطه زمانی با کمترین مقدار رتبه 3 را می گیرد. این روند برای همه افراد یا همه ردیف ها انجام می شود. سپس مجموع رتبه های نقاط زمانی مختلف محاسبه می شود.

به عنوان مثال، در اولین نقطه زمانی مجموع رتبه ها برابر با 7، در دومین نقطه زمانی برابر با 8 و در سومین نقطه زمانی برابر با 9 است. حالا می توانیم بررسی کنیم که مجموع رتبه های این نقاط زمانی چقدر با هم تفاوت دارند.

چرا از رتبه ها استفاده می شود؟

مزیت بزرگ استفاده از رتبه ها این است که اگر میانگین تفاوت ها را بررسی نکنیم و به جای آن از مجموع رتبه ها استفاده کنیم، داده ها نیازی به توزیع نرمال ندارند. به بیان ساده، اگر داده های شما نرمال باشند، از آزمون های پارامتری استفاده می شود. برای بیش از دو نمونه وابسته، این آزمون ANOVA با اندازه گیری های مکرر است.
اما اگر داده های شما نرمال نباشند، از آزمون های ناپارامتری استفاده می شود. برای بیش از دو نمونه وابسته، این آزمون فریدمن است.

فرضیه ها در آزمون فریدمن

این موضوع ما را به سوال تحقیقاتی می رساند که می توانید با آزمون فریدمن به آن پاسخ دهید: آیا تفاوت معناداری بین بیش از دو گروه وابسته وجود دارد؟

  • فرضیه صفر: تفاوت معناداری بین گروه های وابسته وجود ندارد.
  • فرضیه جایگزین: تفاوت معناداری بین گروه های وابسته وجود دارد.

همانطور که قبلاً اشاره شد، آزمون فریدمن از مقادیر واقعی استفاده نمی کند، بلکه از رتبه ها استفاده می کند.

فرمول آزمون فریدمن

برای محاسبه آماره آزمون فریدمن که به آن F فریدمن نیز گفته می‌شود، از فرمول زیر استفاده می‌شود:

فرمول آزمون فریدمن

که در آن N تعداد افراد (نمونه‌ها)، k تعداد شرایط (اندازه‌گیری‌ها یا نمونه‌ها) و R مجموع رتبه‌ها برای هر یک از ستون‌های داده‌ها است. جزئیات بیشتر در مثال عملی توضیح داده شده است.

مفروضات آزمون فریدمن

همانند تمامی آزمون‌های آماری، آزمون فریدمن نیز دارای برخی فرضیات است که به شرح زیر هستند:

  1. داده‌ها باید ترتیبی یا پیوسته باشند. به عنوان مثال، یک متغیر ترتیبی می‌تواند یک سؤال نظرسنجی باشد که میزان رضایت را در یک مقیاس پنج‌درجه‌ای از «بسیار راضی» تا «بسیار ناراضی» ارزیابی می‌کند. مثال‌هایی از متغیرهای پیوسته شامل قد، دما و عملکرد در آزمون (از 0 تا 100) هستند.
  2. داده‌ها باید از یک گروه واحد باشند که در سه یا تعداد بیشتری از نقاط زمانی مختلف یا متغیرهای مرتبط اندازه‌گیری شده باشند. توجه داشته باشید که از نظر فنی، آزمون فریدمن را می‌توان بر روی دو یا چند نمونه/اندازه‌گیری انجام داد، اما در این صورت این آزمون مشابه با آزمون علامت (Sign Test) می‌شود. بنابراین، آزمون فریدمن معمولاً برای سه یا تعداد بیشتری از نمونه‌ها/اندازه‌گیری‌ها به کار می‌رود.
  3. داده‌ها باید از یک نمونه تصادفی انتخاب شده از جامعه‌ای باشند که محقق قصد دارد در مورد آن استنتاج انجام دهد.
  4. بلوک‌های داده باید به صورت مستقل از هم باشند (مجموعه‌های داده نباید بر یکدیگر تأثیر بگذارند).

زمان استفاده از آزمون فریدمن

دو سناریوی مشخص وجود دارد که در آن‌ها استفاده از آزمون فریدمن مفید است:

  • زمانی که یک متغیر کمی (پیوسته یا ترتیبی) مشابه دو (و بیشتر اوقات سه) بار یا بیشتر از یک نمونه در نقاط زمانی مختلف اندازه‌گیری شده باشد (یا از نمونه‌های مختلفی که بر اساس متغیر دیگری با هم مطابقت داده شده‌اند). به عنوان مثال، اندازه گیری های کلسترول از گروهی یکسان از بیماران در یک مطالعه در فواصل سه‌ماهه.
  • زمانی که دو (و بیشتر اوقات سه) یا چند متغیر کمی مرتبط از یک گروه در یک زمان مشابه اندازه‌گیری شده باشند. به عنوان مثال، پاسخ به سه سؤال مرتبط در یک نظرسنجی از همان گروه از افراد.
  • این سناریوها در عمل متفاوت هستند، اما در واقع انواعی از یک سؤال آماری یکسان هستند که هر دو می‌توانند تحت یک آزمون آماری واحد (آزمون فریدمن) بررسی شوند.

تفسیر آزمون فریدمن

مانند آزمون تحلیل واریانس یک طرفه (ANOVA)، نتایج آزمون فرضیه برای آزمون فریدمن به ما این ایده را می‌دهد که آیا مجموعه‌های مختلف از مقادیر به نحوی متفاوت هستند یا خیر، اما مشخص نمی‌کند که کدام یک متفاوت است. این موضوع معمولاً از طریق تحلیل میانه (به عنوان یک معیار گرایش مرکزی) و دامنه بین چارکی (IQR) (به عنوان یک معیار پراکندگی) مجموعه های مختلف و بررسی اینکه آیا الگویی از مقادیر بزرگتر یا کوچکتر در بین آن‌ها وجود دارد، قابل انجام است.

مثال از آزمون فریدمن

شاید بخواهید بدانید که آیا درمان بعد از فتق دیسک روی درک درد بیمار تأثیر دارد یا خیر. برای این منظور، احساس درد را قبل از درمان، در میانه درمان و در انتهای درمان اندازه گیری می کنید. حالا می خواهید بدانید که آیا تفاوتی بین این نقاط زمانی مختلف وجود دارد یا خیر.

بنابراین، متغیر مستقل شما زمان یا پیشرفت درمان در طول زمان است. متغیر وابسته شما درک درد است. شما اکنون پیشرفتی از درک درد را برای هر فرد در طول زمان دارید و می خواهید بدانید که آیا درمان روی درک درد تأثیر داشته است یا خیر.

به بیان ساده، در یک حالت درمان تأثیر دارد و در حالت دیگر تأثیری روی درک درد ندارد. در طول زمان، درک درد در یک حالت تغییر نمی کند و در حالت دیگر تغییر می کند.

محاسبه آزمون فریدمن

فرض کنید می خواهید بدانید که آیا تفاوتی در پاسخگویی افراد در صبح، ظهر و شب وجود دارد یا خیر. برای این منظور، واکنش 7 نفر را در صبح، ظهر و شب اندازه گیری کرده اید.
در مرحله اول، باید به مقادیر، رتبه اختصاص دهید. برای این کار، هر ردیف را به طور جداگانه بررسی می کنیم.

محاسبه آزمون فریدمن

در ردیف اول یا فرد اول، 45 بزرگترین مقدار است و رتبه 1 می گیرد، سپس 36 با رتبه 2 و 34 با رتبه 3 قرار می گیرند. همین کار را برای ردیف دوم انجام می دهیم. در اینجا 36 بزرگترین مقدار است و رتبه 1 می گیرد، سپس 33 با رتبه 2 و 31 با رتبه 3 قرار می گیرند. این روند را برای هر ردیف ادامه می دهیم.

سپس می توانیم مجموع رتبه ها را برای هر زمان از روز محاسبه کنیم. به این ترتیب که همه رتبه ها در هر ستون جمع می شوند. در صبح، مجموع 17، در ظهر مجموع 11 و در شب مجموع 14 به دست می آید.

اگر بین نقاط زمانی مختلف از نظر زمان واکنش تفاوتی وجود نداشته باشد، انتظار می رود که در همه نقاط زمانی، مقدار مورد انتظار را داشته باشیم. مقدار مورد انتظار با استفاده از فرمول اول به دست می آید و در این مثال 14 است. بنابراین، اگر بین صبح، ظهر و شب تفاوتی وجود نداشته باشد، انتظار می رود مجموع رتبه ها در هر سه نقطه زمانی 14 باشد.

محاسبه مقدار Chi2

حال می توانیم مقدار Chi2 را محاسبه کنیم. این مقدار با استفاده از فرمول دوم به دست می آید. N تعداد افراد است، یعنی 7، k تعداد نقاط زمانی است، یعنی 3 و مجموع R2 برابر با 172+112+14217^2 + 11^2 + 14^2 است. بنابراین، مقدار Chi2 برابر با 2.57 می شود.

حال باید تعداد درجه آزادی را پیدا کنیم. این مقدار برابر با تعداد نقاط زمانی منهای 1 است، بنابراین در مثال ما برابر با 2 می شود.

بررسی مقدار بحرانی Chi2 و سطح معناداری

بررسی مقدار بحرانی Chi2 و سطح معناداری

در این مرحله می توانیم مقدار بحرانی Chi2 را در جدول مقادیر بحرانی بخوانیم. برای این کار، از سطح معناداری از پیش تعیین شده، مثلاً 0.05، و تعداد درجه آزادی استفاده می کنیم. در اینجا مقدار بحرانی Chi2 برابر با 5.99 است. این مقدار بزرگتر از مقدار محاسبه شده ماست. بنابراین، فرضیه صفر رد نمی شود و بر اساس این داده ها، تفاوتی بین پاسخگویی در زمان های مختلف وجود ندارد. اگر مقدار محاسبه شده Chi2 بزرگتر از مقدار بحرانی بود، فرضیه صفر را رد می کردیم.

محاسبه آزمون فریدمن با استفاده از DATAtab

محاسبه آزمون فریدمن با استفاده از DATAtab

برای محاسبه آزمون فریدمن می توانید به سادگی از DATAtab استفاده کنید. برای این کار، کافی است به ماشین حساب آزمون فریدمن در DATAtab بروید و داده های خود را در جدول کپی کنید.

تفسیر نتایج آزمون فریدمن

تفسیر نتایج آزمون فریدمن

ابتدا آمار توصیفی را مشاهده می کنید. سپس می توانید مقدار p را بخوانید. اگر دقیقاً نمی دانید که چگونه مقدار p را تفسیر کنید، می توانید به سادگی به تفسیر کلمات نگاه کنید.

آزمون فریدمن نشان داد که تفاوت معناداری بین متغیرها وجود ندارد. Chi2 = 2.57، p = 0.276

اگر مقدار p شما بزرگتر از سطح معناداری تعیین شده شما باشد، در این صورت فرضیه صفر رد نمی شود. فرضیه صفر این است که بین گروه ها تفاوتی وجود ندارد. معمولاً سطح معناداری 0.05 در نظر گرفته می شود، بنابراین این مقدار p بزرگتر است.

آزمون Post-Hoc

علاوه بر این، DATAtab آزمون post-hoc را نیز فراهم می کند. اگر مقدار p شما کوچکتر از 0.05 باشد، می توانید در اینجا بررسی کنید که کدام گروه ها واقعاً با یکدیگر تفاوت دارند.

آزمون Post-Hoc

در اینجا، هر ردیف به دو گروه در نظر گرفته می شود و فرضیه صفر آزمون می شود که آیا هر دو نمونه یکسان هستند یا خیر. مقدار “Adjusted p-value” با ضرب مقدار p در تعداد آزمون ها به دست می آید.

اگر آزمون post-hoc نشان دهد که مقدار p کمتر از 0.05 است، فرض می شود که این گروه ها با هم متفاوت هستند.

اشتراک گذاری این محتوا، پلتفرم خود را انتخاب کنید!
مطالب مرتبط دیگر :

  • الگوریتم خفاش (Bat Algorithm) چیست؟
الگوریتم خفاش (Bat Algorithm) چیست؟

اکتبر 3, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم خفاش (Bat Algorithm) یک الگوریتم فراابتکاری مبتنی بر جمعیت است که برای حل مسائل بهینه سازی پیوسته استفاده می شود. این الگوریتم برای بهینه سازی راه حل ها در رایانش ابری، [...]

  • الگوریتم کرم شب تاب چیست؟
الگوریتم کرم شب تاب چیست؟

اکتبر 3, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم کرم شب تاب چیست؟ الگوریتم های الهام گرفته از زیست، که به عنوان الگوریتم های الهام گرفته از طبیعت یا الگوریتم های تکاملی نیز شناخته می شوند، تکنیک های محاسباتی هستند [...]

  • آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال
آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال

سپتامبر 30, 2024|بدون دیدگاه

چکیده مقاله: آزمون فریدمن ابزاری آماری برای مقایسه نمونه‌ها یا اندازه‌گیری‌های مکرر است زمانی که مفروضات پارامتریک برآورده نمی‌شوند. در واقع آزمون فریدمن توسعه‌ای از آزمون Wilcoxon signed-rank test و آنالوگ ناپارامتری از اندازه‌گیری [...]

  • برنامه نویسی فرانت اند: راهنمای جامع توسعه فرانت اند
برنامه نویسی فرانت اند: راهنمای جامع توسعه فرانت اند

سپتامبر 27, 2024|بدون دیدگاه

چکیده مقاله: اگر بخواهیم فرانت اند (Front-end) یا با اسم های دیگر سمت مشتری یا سمت کاربر را توضیح دهیم بهتر است بدانید که توسعه دهنده فرانت اند (Front-End Developer) به کمک زبان های برنامه [...]

  • برنامه نویسی تحت وب چیست؟ انواع، کاربرد و عملکرد
برنامه نویسی تحت وب چیست؟ انواع، کاربرد و عملکرد

سپتامبر 24, 2024|بدون دیدگاه

چکیده مقاله: امروزه تصور جهانی بدون اینترنت و وب سایت‌ها تقریباً غیرممکن است. در سال‌های اخیر، تقاضا برای برنامه نویسان وب حرفه‌ای به طور چشمگیری افزایش یافته است، بنابراین می توانید انواع کارشناسان این [...]

  • شبکه عصبی چیست؟ عملکرد، اجزا، پیاده سازی و کاربردها
شبکه عصبی چیست؟ عملکرد، اجزا، پیاده سازی و کاربردها

سپتامبر 23, 2024|بدون دیدگاه

چکیده مقاله: شبکه عصبی مجموعه‌ای از الگوریتم ها است که تلاش می‌کند تا روابط زیربنایی را در مجموعه‌ای از داده‌ها از طریق فرآیندی که نحوه عملکرد مغز انسان را تقلید می‌کند، تشخیص دهد. در [...]