آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال

چکیده مقاله:
آزمون فریدمن ابزاری آماری برای مقایسه نمونهها یا اندازهگیریهای مکرر است زمانی که مفروضات پارامتریک برآورده نمیشوند. در واقع آزمون فریدمن توسعهای از آزمون Wilcoxon signed-rank test و آنالوگ ناپارامتری از اندازهگیری های تکراری یک طرفه است. در بسیاری از مواقع لازم است که اندازهگیریهای مکرر یا نمونهها با هم مقایسه شوند، مانند بررسی عملکردهای بیولوژیکی یک فرد در طول زمان یا اندازهگیری مکرر غلظت یک ماده شیمیایی در یک کشت سلولی. در چنین شرایطی، ممکن است از آزمون تحلیل واریانس یکطرفه (ANOVA) استفاده شود، اما همه مجموعه دادهها الزامات پارامتری این آزمون را برآورده نمیکنند و نیاز به جایگزینی مناسب وجود دارد. در این مقاله، یکی از این جایگزینها، یعنی آزمون فریدمن، فرضیات آن، زمان استفاده از آن و همچنین مثال عملی از این آزمون را بررسی میکنیم.
آزمون فریدمن چیست؟
آزمون فریدمن یک آزمون آماری ناپارامتری است که برای تحلیل داده های اندازه گیری مکرر استفاده می شود. این آزمون زمانی کاربرد دارد که فرضیه های نرمال بودن و همگنی واریانس ها برقرار نباشند، بنابراین به عنوان جایگزینی مناسب و مقاوم برای آزمون تحلیل واریانس با اندازه های مکرر (ANOVA) عمل می کند.
آزمون فریدمن، که گاهی اوقات به آن تحلیل واریانس دو طرفه فریدمن با رتبهها نیز گفته میشود، یک آزمون آماری ناپارامتری است که برای بررسی این موضوع استفاده میشود که آیا گروههای دارای سه یا بیشتر اندازهگیری مکرر با یکدیگر تفاوت دارند یا خیر. این آزمون زمانی به کار میرود که دادههای متغیر مورد نظر ترتیبی یا پیوسته باشند. این آزمون ناپارامتری است زیرا هیچگونه فرضی در مورد توزیع دادهها (مانند توزیع نرمال) ندارد. در عمل، آزمون فریدمن اغلب زمانی استفاده میشود که متغیر پیوسته الزامات لازم برای تحلیل واریانس یک طرفه (ANOVA) را برآورده نکند یا هنگامی که متغیر مورد نظر ترتیبی باشد.
نمونه وابسته (اندازه گیری مکرر) چیست؟
در یک نمونه وابسته، مقادیر اندازه گیری شده به هم مرتبط هستند. برای مثال، اگر نمونه ای از افرادی که عمل جراحی زانو انجام داده اند انتخاب شود و این افراد قبل از جراحی و یک هفته و دو هفته بعد از جراحی مورد بررسی قرار گیرند، یک نمونه وابسته محسوب می شود. این به این دلیل است که همان افراد در چندین نقطه زمانی مصاحبه شده اند.
مقایسه آزمون فریدمن با آزمون ANOVA با اندازه گیری های مکرر
شاید بپرسید که تحلیل واریانس با اندازه گیری های مکرر دقیقا همین موضوع را بررسی نمی کند، زیرا این آزمون نیز تفاوت بین سه یا چند نمونه وابسته را مورد آزمون قرار می دهد؟
بله، درست است. آزمون فریدمن معادل ناپارامتری تحلیل واریانس با اندازه گیری های مکرر است. اما تفاوت بین این دو آزمون چیست؟
تحلیل واریانس تفاوت بین مقادیر اندازه گیری شده در نمونه های وابسته را بررسی می کند، در حالی که آزمون فریدمن از رتبه ها به جای مقادیر واقعی اندازه گیری شده استفاده می کند.
چگونه رتبه ها محاسبه می شوند؟
در آزمون فریدمن، زمانی که یک فرد در یک نقطه زمانی بالاترین مقدار را دارد، رتبه 1 به آن اختصاص می یابد. نقطه زمانی با دومین مقدار بالاتر رتبه 2 و نقطه زمانی با کمترین مقدار رتبه 3 را می گیرد. این روند برای همه افراد یا همه ردیف ها انجام می شود. سپس مجموع رتبه های نقاط زمانی مختلف محاسبه می شود.
به عنوان مثال، در اولین نقطه زمانی مجموع رتبه ها برابر با 7، در دومین نقطه زمانی برابر با 8 و در سومین نقطه زمانی برابر با 9 است. حالا می توانیم بررسی کنیم که مجموع رتبه های این نقاط زمانی چقدر با هم تفاوت دارند.
چرا از رتبه ها استفاده می شود؟
مزیت بزرگ استفاده از رتبه ها این است که اگر میانگین تفاوت ها را بررسی نکنیم و به جای آن از مجموع رتبه ها استفاده کنیم، داده ها نیازی به توزیع نرمال ندارند. به بیان ساده، اگر داده های شما نرمال باشند، از آزمون های پارامتری استفاده می شود. برای بیش از دو نمونه وابسته، این آزمون ANOVA با اندازه گیری های مکرر است.
اما اگر داده های شما نرمال نباشند، از آزمون های ناپارامتری استفاده می شود. برای بیش از دو نمونه وابسته، این آزمون فریدمن است.
فرضیه ها در آزمون فریدمن
این موضوع ما را به سوال تحقیقاتی می رساند که می توانید با آزمون فریدمن به آن پاسخ دهید: آیا تفاوت معناداری بین بیش از دو گروه وابسته وجود دارد؟
- فرضیه صفر: تفاوت معناداری بین گروه های وابسته وجود ندارد.
- فرضیه جایگزین: تفاوت معناداری بین گروه های وابسته وجود دارد.
همانطور که قبلاً اشاره شد، آزمون فریدمن از مقادیر واقعی استفاده نمی کند، بلکه از رتبه ها استفاده می کند.
فرمول آزمون فریدمن
برای محاسبه آماره آزمون فریدمن که به آن F فریدمن نیز گفته میشود، از فرمول زیر استفاده میشود:
که در آن N تعداد افراد (نمونهها)، k تعداد شرایط (اندازهگیریها یا نمونهها) و R مجموع رتبهها برای هر یک از ستونهای دادهها است. جزئیات بیشتر در مثال عملی توضیح داده شده است.
مفروضات آزمون فریدمن
همانند تمامی آزمونهای آماری، آزمون فریدمن نیز دارای برخی فرضیات است که به شرح زیر هستند:
- دادهها باید ترتیبی یا پیوسته باشند. به عنوان مثال، یک متغیر ترتیبی میتواند یک سؤال نظرسنجی باشد که میزان رضایت را در یک مقیاس پنجدرجهای از «بسیار راضی» تا «بسیار ناراضی» ارزیابی میکند. مثالهایی از متغیرهای پیوسته شامل قد، دما و عملکرد در آزمون (از 0 تا 100) هستند.
- دادهها باید از یک گروه واحد باشند که در سه یا تعداد بیشتری از نقاط زمانی مختلف یا متغیرهای مرتبط اندازهگیری شده باشند. توجه داشته باشید که از نظر فنی، آزمون فریدمن را میتوان بر روی دو یا چند نمونه/اندازهگیری انجام داد، اما در این صورت این آزمون مشابه با آزمون علامت (Sign Test) میشود. بنابراین، آزمون فریدمن معمولاً برای سه یا تعداد بیشتری از نمونهها/اندازهگیریها به کار میرود.
- دادهها باید از یک نمونه تصادفی انتخاب شده از جامعهای باشند که محقق قصد دارد در مورد آن استنتاج انجام دهد.
- بلوکهای داده باید به صورت مستقل از هم باشند (مجموعههای داده نباید بر یکدیگر تأثیر بگذارند).
زمان استفاده از آزمون فریدمن
دو سناریوی مشخص وجود دارد که در آنها استفاده از آزمون فریدمن مفید است:
- زمانی که یک متغیر کمی (پیوسته یا ترتیبی) مشابه دو (و بیشتر اوقات سه) بار یا بیشتر از یک نمونه در نقاط زمانی مختلف اندازهگیری شده باشد (یا از نمونههای مختلفی که بر اساس متغیر دیگری با هم مطابقت داده شدهاند). به عنوان مثال، اندازه گیری های کلسترول از گروهی یکسان از بیماران در یک مطالعه در فواصل سهماهه.
- زمانی که دو (و بیشتر اوقات سه) یا چند متغیر کمی مرتبط از یک گروه در یک زمان مشابه اندازهگیری شده باشند. به عنوان مثال، پاسخ به سه سؤال مرتبط در یک نظرسنجی از همان گروه از افراد.
- این سناریوها در عمل متفاوت هستند، اما در واقع انواعی از یک سؤال آماری یکسان هستند که هر دو میتوانند تحت یک آزمون آماری واحد (آزمون فریدمن) بررسی شوند.
تفسیر آزمون فریدمن
مانند آزمون تحلیل واریانس یک طرفه (ANOVA)، نتایج آزمون فرضیه برای آزمون فریدمن به ما این ایده را میدهد که آیا مجموعههای مختلف از مقادیر به نحوی متفاوت هستند یا خیر، اما مشخص نمیکند که کدام یک متفاوت است. این موضوع معمولاً از طریق تحلیل میانه (به عنوان یک معیار گرایش مرکزی) و دامنه بین چارکی (IQR) (به عنوان یک معیار پراکندگی) مجموعه های مختلف و بررسی اینکه آیا الگویی از مقادیر بزرگتر یا کوچکتر در بین آنها وجود دارد، قابل انجام است.
مثال از آزمون فریدمن
شاید بخواهید بدانید که آیا درمان بعد از فتق دیسک روی درک درد بیمار تأثیر دارد یا خیر. برای این منظور، احساس درد را قبل از درمان، در میانه درمان و در انتهای درمان اندازه گیری می کنید. حالا می خواهید بدانید که آیا تفاوتی بین این نقاط زمانی مختلف وجود دارد یا خیر.
بنابراین، متغیر مستقل شما زمان یا پیشرفت درمان در طول زمان است. متغیر وابسته شما درک درد است. شما اکنون پیشرفتی از درک درد را برای هر فرد در طول زمان دارید و می خواهید بدانید که آیا درمان روی درک درد تأثیر داشته است یا خیر.
به بیان ساده، در یک حالت درمان تأثیر دارد و در حالت دیگر تأثیری روی درک درد ندارد. در طول زمان، درک درد در یک حالت تغییر نمی کند و در حالت دیگر تغییر می کند.
محاسبه آزمون فریدمن
فرض کنید می خواهید بدانید که آیا تفاوتی در پاسخگویی افراد در صبح، ظهر و شب وجود دارد یا خیر. برای این منظور، واکنش 7 نفر را در صبح، ظهر و شب اندازه گیری کرده اید.
در مرحله اول، باید به مقادیر، رتبه اختصاص دهید. برای این کار، هر ردیف را به طور جداگانه بررسی می کنیم.
در ردیف اول یا فرد اول، 45 بزرگترین مقدار است و رتبه 1 می گیرد، سپس 36 با رتبه 2 و 34 با رتبه 3 قرار می گیرند. همین کار را برای ردیف دوم انجام می دهیم. در اینجا 36 بزرگترین مقدار است و رتبه 1 می گیرد، سپس 33 با رتبه 2 و 31 با رتبه 3 قرار می گیرند. این روند را برای هر ردیف ادامه می دهیم.
سپس می توانیم مجموع رتبه ها را برای هر زمان از روز محاسبه کنیم. به این ترتیب که همه رتبه ها در هر ستون جمع می شوند. در صبح، مجموع 17، در ظهر مجموع 11 و در شب مجموع 14 به دست می آید.
اگر بین نقاط زمانی مختلف از نظر زمان واکنش تفاوتی وجود نداشته باشد، انتظار می رود که در همه نقاط زمانی، مقدار مورد انتظار را داشته باشیم. مقدار مورد انتظار با استفاده از فرمول اول به دست می آید و در این مثال 14 است. بنابراین، اگر بین صبح، ظهر و شب تفاوتی وجود نداشته باشد، انتظار می رود مجموع رتبه ها در هر سه نقطه زمانی 14 باشد.
محاسبه مقدار Chi2
حال می توانیم مقدار Chi2 را محاسبه کنیم. این مقدار با استفاده از فرمول دوم به دست می آید. N تعداد افراد است، یعنی 7، k تعداد نقاط زمانی است، یعنی 3 و مجموع R2 برابر با 172+112+14217^2 + 11^2 + 14^2172+112+142 است. بنابراین، مقدار Chi2 برابر با 2.57 می شود.
حال باید تعداد درجه آزادی را پیدا کنیم. این مقدار برابر با تعداد نقاط زمانی منهای 1 است، بنابراین در مثال ما برابر با 2 می شود.
بررسی مقدار بحرانی Chi2 و سطح معناداری
در این مرحله می توانیم مقدار بحرانی Chi2 را در جدول مقادیر بحرانی بخوانیم. برای این کار، از سطح معناداری از پیش تعیین شده، مثلاً 0.05، و تعداد درجه آزادی استفاده می کنیم. در اینجا مقدار بحرانی Chi2 برابر با 5.99 است. این مقدار بزرگتر از مقدار محاسبه شده ماست. بنابراین، فرضیه صفر رد نمی شود و بر اساس این داده ها، تفاوتی بین پاسخگویی در زمان های مختلف وجود ندارد. اگر مقدار محاسبه شده Chi2 بزرگتر از مقدار بحرانی بود، فرضیه صفر را رد می کردیم.
محاسبه آزمون فریدمن با استفاده از DATAtab
برای محاسبه آزمون فریدمن می توانید به سادگی از DATAtab استفاده کنید. برای این کار، کافی است به ماشین حساب آزمون فریدمن در DATAtab بروید و داده های خود را در جدول کپی کنید.
تفسیر نتایج آزمون فریدمن
ابتدا آمار توصیفی را مشاهده می کنید. سپس می توانید مقدار p را بخوانید. اگر دقیقاً نمی دانید که چگونه مقدار p را تفسیر کنید، می توانید به سادگی به تفسیر کلمات نگاه کنید.
آزمون فریدمن نشان داد که تفاوت معناداری بین متغیرها وجود ندارد. Chi2 = 2.57، p = 0.276
اگر مقدار p شما بزرگتر از سطح معناداری تعیین شده شما باشد، در این صورت فرضیه صفر رد نمی شود. فرضیه صفر این است که بین گروه ها تفاوتی وجود ندارد. معمولاً سطح معناداری 0.05 در نظر گرفته می شود، بنابراین این مقدار p بزرگتر است.
آزمون Post-Hoc
علاوه بر این، DATAtab آزمون post-hoc را نیز فراهم می کند. اگر مقدار p شما کوچکتر از 0.05 باشد، می توانید در اینجا بررسی کنید که کدام گروه ها واقعاً با یکدیگر تفاوت دارند.
در اینجا، هر ردیف به دو گروه در نظر گرفته می شود و فرضیه صفر آزمون می شود که آیا هر دو نمونه یکسان هستند یا خیر. مقدار “Adjusted p-value” با ضرب مقدار p در تعداد آزمون ها به دست می آید.
اگر آزمون post-hoc نشان دهد که مقدار p کمتر از 0.05 است، فرض می شود که این گروه ها با هم متفاوت هستند.
مدیر2025-04-19T17:38:26+04:30آوریل 19, 2025|0 Comments
چکیده مقاله: تفاوت طراح سایت و برنامه نویس فرانت اند یکی از موضوعاتی است که بسیاری از افرادی که قصد ورود به دنیای طراحی و توسعه وب را دارند، با آن مواجه می شوند. [...]
مدیر2025-04-18T23:37:01+04:30آوریل 18, 2025|0 Comments
چکیده مقاله: تفاوت طراحی سایت و طراحی گرافیک در دنیای دیجیتال امروز از اهمیت بالایی برخوردار است، چرا که هر کدام نقش متفاوتی در تجربه کاربر و ظاهر محصولات دیجیتال ایفا می کنند. طراحی [...]
مدیر2025-04-17T01:57:00+04:30آوریل 17, 2025|0 Comments
چکیده مقاله: طراحی یک وب سایت حرفه ای برای خدمات پزشکی نیازمند برنامه ریزی دقیق و شناخت نیازهای کاربران است. در پاسخ به سوال "چگونه یک سایت پزشکی طراحی کنیم؟" باید ابتدا مشخص شود [...]
مدیر2025-04-15T00:51:03+04:30آوریل 15, 2025|0 Comments
چکیده مقاله: تفاوت طراح سایت و توسعه دهنده سایت در واقع به دو نقش متفاوت در فرایند ساخت و نگهداری یک وب سایت اشاره دارد. طراح سایت بیشتر بر جنبههای ظاهری و تجربه کاربری [...]
مدیر2025-04-12T18:22:03+04:30آوریل 12, 2025|0 Comments
چکیده مقاله: طراحی سایت یکی از مهم ترین مراحل در راه اندازی یک کسب و کار آنلاین است. برای داشتن یک وب سایت موفق، انتخاب ابزار مناسب برای طراحی آن از اهمیت زیادی برخوردار [...]
مدیر2025-04-10T00:50:03+04:30آوریل 10, 2025|0 Comments
چکیده مقاله: در دنیای امروز که تکنولوژی و اینترنت بخش جدایی ناپذیری از زندگی انسان ها شده اند، حضور در فضای آنلاین برای هر حرفه ای ضروری به نظر می رسد. پزشکان نیز از [...]