انواع آزمون همبستگی: فرمول، مفروضات و کاربرد

انواع آزمون همبستگی: فرمول، مفروضات و کاربرد
توسط منتشر شده در : اکتبر 7, 2024دسته بندی: مقالات تحلیل آماریLast Updated: اکتبر 7, 2024بدون دیدگاه on انواع آزمون همبستگی: فرمول، مفروضات و کاربردنمایش: 117
فهرست مطالب

چکیده مقاله:
همبستگی یک تحلیل دو متغیره است که میزان وابستگی و جهت رابطه بین دو متغیر را اندازه گیری می کند. از نظر قدرت رابطه، مقدار ضریب همبستگی بین +1 و -1 متغیر است. مقدار ±1 نشان دهنده درجه کامل وابستگی بین دو متغیر است. هرچه مقدار ضریب همبستگی به صفر نزدیک تر شود، رابطه بین دو متغیر ضعیف تر خواهد بود. جهت رابطه با علامت ضریب مشخص می شود؛ علامت + نشان دهنده رابطه مثبت و علامت – نشان دهنده رابطه منفی است. معمولاً در آمار چهار نوع همبستگی را اندازه گیری می کنیم: همبستگی پیرسون، همبستگی رتبه ای کندال، همبستگی اسپیرمن و همبستگی نقطه-بایسریال. اما انواع دیگری از آزمون های همبستگی نیز وجود دارد که در این مقاله به طور کامل به بررسی انواع آزمون همبستگی می پردازیم.

همبستگی چیست؟

همبستگی یا پژوهش همبستگی، یک اندازه‌گیری آماری است که توصیف می‌کند دو یا چند متغیر تا چه حد در نوسان هستند. به عبارت دیگر، وقتی که ارزش یکی از متغیرها تغییر می‌کند، همبستگی نشان می‌دهد که ارزش متغیر دیگر چگونه در پاسخ به این تغییر، جابجا می‌شود.

همبستگی می‌تواند مثبت، منفی یا صفر باشد که نشان‌دهنده جهت و شدت رابطه بین متغیرها است. درک همبستگی به پژوهش و تحلیل داده‌ها کمک می‌کند تا الگوها و روابط بین متغیرها شناسایی شود که می‌تواند در تصمیم‌گیری و پیش‌بینی‌ها مفید باشد.

فرمول ضریب همبستگی پیرسون به طور رایج برای کمی سازی قدرت و جهت روابط خطی بین دو متغیر استفاده می‌شود. این ضریب یکی از شناخته شده ترین انواع اندازه‌گیری های همبستگی در آمار است.

درک اینکه آیا یک همبستگی قوی یا ضعیف است، برای چند دلیل بسیار حائز اهمیت است:

  • تصمیم گیری: همبستگی های قوی می توانند به تصمیم گیری مطمئن تر کمک کنند، در حالی که همبستگی های ضعیف نشان می‌دهند که عوامل دیگری ممکن است بر نتیجه تأثیر بگذارند.
  • دقت پیش بینی: همبستگی های قوی پیش بینی‌های قابل اعتمادتری نسبت به همبستگی های ضعیف ارائه می‌دهند.
  • پژوهش و تحلیل: شناسایی قدرت همبستگی ها به درک دینامیک‌های زیرین بین متغیرها کمک می‌کند و مسیر تحقیقات بعدی را هدایت می‌کند.

انواع آزمون همبستگی

آزمون های همبستگی یکی از متداول ترین روش‌های آماری هستند که در بسیاری از حوزه‌ها مانند تحلیل داده‌های اکتشافی، مدل‌سازی ساختاری، مهندسی داده و غیره به کار می‌روند. در این بخش، انواع آزمون همبستگی را با جزئیات بیشتری توضیح می دهیم. همچنین مفروضات و کاربردهای هر روش نیز ذکر می شود.

1. همبستگی پیرسون (Pearson’s Correlation)

همبستگی پیرسون متداول‌ترین روش همبستگی است که برای اندازه‌گیری شدت و جهت رابطه خطی بین دو متغیر پیوسته استفاده می‌شود. مقدار این ضریب از -1 تا +1 متغیر است. مقدار +1 نشان‌دهنده رابطه مثبت کامل، مقدار -1 نشان‌دهنده رابطه منفی کامل و مقدار 0 نشان‌دهنده عدم رابطه خطی بین دو متغیر است.

فرمول محاسبه:

r_xy = cov(x, y) / (SD_x * SD_y)

که در آن:

  • cov(x, y) = کوواریانس دو متغیر x و y
  • SD_x و SD_y = انحراف معیارهای متغیرهای x و y

مفروضات:

  1. داده‌ها دارای توزیع نرمال باشند.
  2. رابطه بین متغیرها خطی باشد.
  3. داده ها مستقل از یکدیگر باشند.
  4. هیچ داده پرت (Outlier) بزرگی وجود نداشته باشد.

کاربرد: این روش زمانی کاربرد دارد که بخواهیم رابطه بین دو متغیر پیوسته را بررسی کنیم و اطمینان داریم که رابطه خطی بین آن‌ها برقرار است. برای مثال، بررسی رابطه بین قد و وزن افراد.

2. همبستگی رتبه ای اسپیرمن (Spearman’s Rank Correlation)

همبستگی اسپیرمن یک آزمون غیرپارامتریک برای ارزیابی رابطه بین دو متغیر است و نیازی به فرض نرمال بودن داده‌ها ندارد. این روش بر اساس رتبه بندی داده‌ها عمل می‌کند و برای داده‌های رتبه‌ای یا زمانی که رابطه بین متغیرها غیرخطی باشد به کار می‌رود.

فرمول محاسبه:

r_s = cov(rank(x), rank(y)) / (SD(rank(x)) * SD(rank(y)))

که در آن:

  • rank(x) و rank(y) = رتبه‌های متغیرهای x و y

مفروضات:

  1. داده ها دارای رابطه ای تک موتونیک (Monotonic) باشند.
  2. داده ها مستقل از یکدیگر باشند.
  3. داده های پرت می توانند تأثیر داشته باشند اما به دلیل استفاده از رتبه، تأثیر آن‌ها کاهش می‌یابد.

کاربرد: از این روش برای ارزیابی روابط غیرخطی یا زمانی که داده‌ها توزیع نرمال ندارند، استفاده می‌شود. برای مثال، رابطه بین رتبه تحصیلی و نمرات آزمون.

3. همبستگی رتبه ای کندال (Kendall’s Rank Correlation)

همبستگی کندال به بررسی جهت گیری کلی بین جفت های مشاهداتی می‌پردازد. به جای اندازه‌گیری میزان وابستگی، درصد جفت‌های هم‌سو (Concordant) و ناهم‌سو (Discordant) را محاسبه می‌کند. به دلیل حساسیت کمتر به خطاهای بزرگ و ناهنجاری‌ها، روش مناسبی برای داده‌های رتبه‌ای است.

فرمول محاسبه:

τ_xy = 2 * (Σ(sign(x_i – x_j) * sign(y_i – y_j))) / n(n – 1)

که در آن:

  • Σ = مجموع تمامی جفت های ممکن
  • sign(x_i – x_j) = نشانه (مثبت یا منفی) تفاوت مقادیر x_i و x_j

مفروضات:

  1. داده ها مستقل از یکدیگر باشند.
  2. داده ها به صورت رتبه‌ای یا ترتیبی باشند.
  3. داده ها توزیع نرمال نداشته باشند.

کاربرد: از این روش در داده‌هایی استفاده می‌شود که دارای توزیع نامتعارف هستند و تحلیل همبستگی از نوع پیوسته به کار نمی‌رود. مثلاً بررسی رابطه بین میزان رضایت مشتریان از خدمات و میزان خرید آن‌ها.

4. همبستگی میانگین میانی (Biweight Midcorrelation)

همبستگی میانگین میانی برای بررسی رابطه بین دو متغیر به کار می‌رود که به جای میانگین، از میانه استفاده می‌کند. این روش حساسیت کمتری به داده‌های پرت دارد و برای شرایطی که داده‌های پرت زیادی وجود دارد، مناسب است.

فرمول محاسبه: فرمول این همبستگی پیچیده‌تر از همبستگی پیرسون است و بر اساس فاصله میانگین-میانه و میزان پخش شدگی داده‌ها محاسبه می‌شود.

مفروضات:

  1. داده‌ها باید ترتیبی باشند.
  2. داده‌ها می‌توانند دارای نقاط پرت باشند.

کاربرد: این روش در شرایطی استفاده می‌شود که داده‌ها دارای ناهنجاری‌های زیادی هستند و روش‌های دیگر مانند همبستگی پیرسون یا اسپیرمن مناسب نیستند.

5. همبستگی فاصله ای (Distance Correlation)

همبستگی فاصله‌ای میزان وابستگی خطی و غیرخطی بین دو متغیر یا دو بردار تصادفی را اندازه‌گیری می‌کند. این روش بر اساس فاصله بین نقاط داده‌ها عمل می‌کند و محدود به رابطه خطی نیست.

فرمول محاسبه: فرمول دقیق این همبستگی بر اساس محاسبه میانگین فاصله‌های اقلیدسی بین نقاط داده‌ها است و از مفاهیم پیچیده ریاضی استفاده می‌کند.

مفروضات:

  1. داده‌ها باید فاصله‌ای (Interval) یا نسبی (Ratio) باشند.
  2. داده‌ها می‌توانند وابستگی غیرخطی داشته باشند.

کاربرد: همبستگی فاصله‌ای برای بررسی رابطه غیرخطی بین متغیرها و زمانی که وابستگی‌های پیچیده‌تری نسبت به روش‌های دیگر وجود دارد، استفاده می‌شود. برای مثال، بررسی رابطه غیرخطی بین میزان فروش و تعداد تبلیغات.

6. همبستگی نقطه-بایسریال (Point-Biserial Correlation)

این روش برای بررسی رابطه بین یک متغیر پیوسته و یک متغیر دوحالته (دوتایی) استفاده می‌شود. این روش مشابه همبستگی پیرسون است، اما برای داده‌های دوتایی به کار می‌رود.

فرمول محاسبه:

r_pb = (M1 – M2) / sqrt(SD^2 * p * (1 – p))

که در آن:

  • M1 و M2 = میانگین‌های دو گروه مختلف
  • p = احتمال وقوع یکی از حالات متغیر دوحالته

مفروضات:

  1. یکی از متغیرها باید پیوسته و دیگری دوتایی باشد.
  2. داده‌های پیوسته باید توزیع نرمال داشته باشند.

کاربرد: این روش برای بررسی رابطه بین متغیرهایی مانند نمرات آزمون (پیوسته) و وضعیت قبولی یا ردی (دوتایی) به کار می‌رود.

7. همبستگی پیچشی میانگین (Percentage Bend Correlation)

همبستگی پیچشی میانگین (Percentage Bend Correlation) که توسط ویلکاکس (Wilcox, 1994) معرفی شد، برای داده‌هایی به کار می‌رود که نقاط پرت زیادی دارند. این روش بر اساس کاهش وزن درصد خاصی از مشاهدات حاشیه‌ای است که از میانه انحراف دارند (به طور پیش‌فرض 20 درصد). در این روش، مشاهدات حاشیه‌ای که به عنوان نقاط پرت در نظر گرفته می‌شوند، وزن کمتری در محاسبه همبستگی دارند.

فرمول محاسبه: این فرمول با استفاده از میانگین پیچشی (Percentage Bend Mean) و محاسبه کوواریانس‌های کاهش‌یافته مشاهدات به دست می‌آید.

مفروضات:

  1. داده‌ها دارای توزیع غیرنرمال باشند یا حاوی نقاط پرت زیادی باشند.
  2. متغیرها باید فاصله‌ای (Interval) یا نسبی (Ratio) باشند.

کاربرد: این روش برای ارزیابی رابطه بین متغیرها در داده‌هایی که دارای انحراف‌های شدید یا نقاط پرت هستند، کاربرد دارد. به عنوان مثال، بررسی رابطه بین حقوق کارمندان و ساعت‌های کار اضافی آن‌ها در حضور نقاط پرت زیاد.

8. همبستگی پی-شپرد (Shepherd’s Pi Correlation)

این نوع همبستگی مشابه همبستگی رتبه‌ای اسپیرمن است اما برای حذف اثر نقاط پرت از روشی به نام فاصله ماهالانوبیس استفاده می‌کند. در این روش، نقاط پرت با استفاده از بوت‌استرپ حذف می‌شوند و سپس همبستگی اسپیرمن روی داده‌های اصلاح‌شده محاسبه می‌شود.

فرمول محاسبه: فرمول محاسبه همان فرمول همبستگی اسپیرمن است، اما پس از حذف نقاط پرت از داده‌ها:

r_s = cov(rank(x), rank(y)) / (SD(rank(x)) * SD(rank(y)))

مفروضات:

  1. داده‌ها دارای نقاط پرت قابل توجهی باشند.
  2. داده‌ها توزیع نرمال یا رتبه‌ای داشته باشند.

کاربرد: این روش در تحلیل داده‌هایی که دارای نقاط پرت بسیاری هستند، استفاده می‌شود. به عنوان مثال، بررسی رابطه بین نمرات درسی و میزان مطالعه در شرایطی که برخی دانش‌آموزان عملکرد غیرمعمول دارند.

9. ضریب بلومکویست (Blomqvist’s Coefficient)

ضریب بلومکویست (Blomqvist’s Coefficient) که به عنوان بتای بلومکویست یا همبستگی میانی نیز شناخته می‌شود، یک روش غیرپارامتریک برای محاسبه همبستگی است. این روش به جای میانگین، از میانه داده‌ها برای ارزیابی رابطه استفاده می‌کند. از این رو، تأثیر داده‌های پرت را کاهش می‌دهد و برای داده‌های رتبه‌ای بسیار مناسب است.

فرمول محاسبه: این ضریب معمولاً به شکل رابطه خطی یا تفاوت در میانه داده‌ها بیان می‌شود، اما فرم کلی به صورت زیر است:

β = Median(Y|X) / Median(X)

مفروضات:

  1. داده‌ها دارای توزیع غیرنرمال باشند.
  2. داده‌ها به صورت رتبه‌ای یا میانه‌ای بررسی شوند.

کاربرد: از ضریب بلومکویست در مواردی استفاده می‌شود که داده‌ها بسیار نامتعارف هستند و نمی‌توان از روش‌های معمول استفاده کرد. به عنوان مثال، بررسی رابطه بین میزان حضور در کلاس و رضایت تحصیلی دانش‌آموزان.

10. همبستگی هوفدینگ (Hoeffding’s D)

ضریب D هوفدینگ یک معیار غیرپارامتریک برای اندازه‌گیری وابستگی است که می‌تواند انواع مختلفی از وابستگی‌های غیرخطی را تشخیص دهد. این ضریب رابطه‌ای بین متغیرها پیدا می‌کند که روش‌های همبستگی معمولی مانند پیرسون قادر به تشخیص آن نیستند.

فرمول محاسبه: فرمول محاسبه این ضریب بر اساس محاسبه انحراف رتبه‌ها و مقایسه زوج‌های مرتب شده است. فرمول کلی آن به صورت زیر است:

D = 1 – (2/n^2) Σ Σ (H_ij – H_i* – H_*j + H_**)^2

که در آن:

  • H_ij = تعداد داده‌هایی که هم در x و هم در y از داده‌های i و j کمتر هستند.
  • H_i* = میانگین مقادیر H در ردیف i.
  • H_*j = میانگین مقادیر H در ستون j.
  • H_** = میانگین کلی مقادیر H.

مفروضات:

  1. داده‌ها به صورت رتبه‌ای باشند.
  2. داده‌ها می‌توانند غیرخطی و نامتعارف باشند.

کاربرد: این روش برای بررسی وابستگی‌های پیچیده‌تر مانند بررسی روابط غیرخطی بین میزان درآمد و رضایت شغلی استفاده می‌شود.

11. همبستگی گاما (Gamma Correlation)

همبستگی گاما که با نام آماره گاما گودمن-کروکسال نیز شناخته می‌شود، روشی است که به اندازه‌گیری رابطه بین دو متغیر رتبه‌ای با تعداد زیاد تساوی‌های احتمالی (Ties) می‌پردازد. این روش برای داده‌های دارای تساوی (مقادیر مساوی) زیاد کاربرد دارد.

فرمول محاسبه:

Gamma = (C – D) / (C + D)

که در آن:

  • C = تعداد جفت های همسو (Concordant Pairs).
  • D = تعداد جفت های ناهمسو (Discordant Pairs).

مفروضات:

  1. داده‌ها باید به صورت رتبه‌ای باشند.
  2. داده‌ها می‌توانند دارای تساوی‌های متعدد باشند.

کاربرد: این روش برای تحلیل داده‌هایی مانند بررسی رابطه بین سطح تحصیلات و درآمد در حالتی که تعداد زیادی تساوی در سطوح تحصیلی مختلف وجود دارد، به کار می‌رود.

12. همبستگی رتبه‌ای گاوسی (Gaussian Rank Correlation)

این روش که به عنوان همبستگی رتبه‌ای گاوسی شناخته می‌شود، از رتبه‌بندی داده‌ها و محاسبه کوانتیل‌های گاوسی برای ارزیابی وابستگی استفاده می‌کند. این روش برای داده‌هایی با ناهنجاری و توزیع‌های نامتعارف مناسب است.

فرمول محاسبه: فرمول محاسبه این ضریب بر اساس تبدیل گاوسی مقادیر رتبه‌بندی شده است و از رویکردهایی مانند نرمال‌سازی غیرخطی بهره می‌برد.

مفروضات:

  1. داده‌ها می‌توانند ناهنجار یا غیرنرمال باشند.
  2. داده‌ها می‌توانند به صورت رتبه‌ای یا ترتیبی باشند.

کاربرد: این روش برای بررسی رابطه بین متغیرهایی مانند بررسی اثرات درمانی در گروه‌های مختلف بیماران استفاده می‌شود.

13. همبستگی نقطه‌ای-بیسریال (Point-Biserial Correlation)

همبستگی نقطه‌ای-بیسریال (Point-Biserial Correlation) برای اندازه‌گیری رابطه بین یک متغیر پیوسته (Continuous) و یک متغیر دوحالته (Dichotomous) به کار می‌رود. این نوع همبستگی در صورتی که متغیر دوحالته دارای طبقات صفر و یک باشد، مشابه همبستگی پیرسون عمل می‌کند. این روش معمولاً برای داده‌هایی استفاده می‌شود که در آن‌ها یک متغیر به شکل دوحالته (مثلاً موفقیت/عدم موفقیت) و متغیر دیگر به صورت پیوسته (مثلاً نمره آزمون) باشد.

فرمول محاسبه: فرمول همبستگی نقطه‌ای-بیسریال به صورت زیر است:

r_pb = (M1 – M0) / S_total * sqrt(p * q)

که در آن:

  • 1M = میانگین گروه با مقدار 1،
  • 0M = میانگین گروه با مقدار 0،
  • totalS = انحراف معیار کل،
  • p = نسبت موارد در گروه 1،
  • q = نسبت موارد در گروه 0 (که q=1−pq = 1 – p می‌باشد).

مفروضات:

  1. متغیر پیوسته دارای توزیع نرمال باشد.
  2. متغیر دوحالته فقط دو طبقه داشته باشد (مانند بله/خیر).

کاربرد: همبستگی نقطه‌ای-بیسریال برای بررسی روابطی مانند تأثیر جنسیت (زن/مرد) بر نمرات آزمون‌ها، یا بررسی ارتباط بین موفقیت در قبولی و ساعات مطالعه استفاده می‌شود.

14. همبستگی بیسریال (Biserial Correlation)

همبستگی بیسریال (Biserial Correlation) زمانی به کار می‌رود که یکی از متغیرها دوحالته باشد، اما در واقع دارای پیوستگی پنهانی (Underlying Continuity) باشد. به عنوان مثال، می‌توان متغیر “سطح استرس” را به صورت دوحالته (پایین/بالا) نشان داد، در حالی که در واقع این متغیر به صورت پیوسته قابل اندازه‌گیری است. این نوع همبستگی در مواردی به کار می‌رود که فرض می‌شود متغیر دوحالته دارای مقیاس پیوسته‌ای در پس‌زمینه است.

فرمول محاسبه: فرمول همبستگی بیسریال به صورت زیر است:

r_b = (M1 – M0) / SD * sqrt(n1 * n0 / (n^2))

که در آن:

  • 1M و 0M = میانگین های گروه 1 و گروه 0،
  • 1n و 0n = تعداد نمونه ها در گروه 1 و گروه 0،
  • = تعداد کل نمونه ها،
  • SD = انحراف معیار کل.

مفروضات:

  1. متغیر دوحالته دارای پیوستگی پنهانی باشد.
  2. متغیر پیوسته دارای توزیع نرمال باشد.

کاربرد: این روش برای بررسی رابطه بین سطح استرس (پایین/بالا) و نمرات آزمون یا تأثیر دارو (دارو/پلاسبو) بر میزان فشار خون استفاده می‌شود.

15. همبستگی وینزوریزه شده (Winsorized Correlation)

همبستگی وینزوریزه شده (Winsorized Correlation) برای داده‌هایی به کار می‌رود که حاوی نقاط پرت زیادی هستند. در این روش، داده‌های پرت به جای حذف، به مقادیر نزدیک‌تر به داده‌های اصلی تبدیل می‌شوند تا اثر آن‌ها کاهش یابد. در نتیجه، تأثیر مقادیر حدی بر همبستگی کمتر شده و نتایج باثبات‌تری به دست می‌آید.

فرمول محاسبه: در این روش، مقادیر حدی به نقاط مشخصی (مانند صدک‌های خاص) تبدیل می‌شوند و سپس از فرمول همبستگی پیرسون یا سایر روش‌های همبستگی استفاده می‌شود.

مفروضات:

  1. داده‌ها باید به صورت پیوسته باشند.
  2. داده‌ها می‌توانند نرمال یا غیرنرمال باشند، اما وجود نقاط پرت قابل توجه باشد.

کاربرد: از این روش برای تحلیل داده‌های مالی که دارای مقادیر حدی (مانند بازده سهام) هستند یا برای بررسی تأثیر فاکتورهای خطر (مانند سن) بر بیماری‌های خاص استفاده می‌شود.

16. همبستگی پلیکوریک (Polychoric Correlation)

همبستگی پلیکوریک (Polychoric Correlation) روشی برای اندازه‌گیری رابطه بین دو متغیر ترتیبی (Ordinal) است که فرض می‌شود در پس‌زمینه، هر دو متغیر دارای توزیع نرمال پیوسته هستند. این روش معمولاً برای داده‌هایی که به صورت مقیاس‌های ترتیبی (مانند امتیاز 1 تا 5) جمع‌آوری شده‌اند، مناسب است.

فرمول محاسبه: همبستگی پلیکوریک با استفاده از تابع احتمال مشترک نرمال دو متغیری محاسبه می‌شود. محاسبه این ضریب پیچیده‌تر از سایر همبستگی‌هاست و از روش‌های تخمینی برای آن استفاده می‌شود.

مفروضات:

  1. هر دو متغیر باید به صورت ترتیبی باشند.
  2. در پس‌زمینه، هر دو متغیر باید توزیع نرمال پیوسته داشته باشند.

کاربرد: این روش برای بررسی رابطه بین دو متغیر روان‌سنجی مانند سطح رضایت (خیلی کم تا خیلی زیاد) و انگیزه (پایین تا بالا) یا بررسی پرسشنامه‌هایی با مقیاس‌های ترتیبی به کار می‌رود.

17. همبستگی تتراکوریک (Tetrachoric Correlation)

همبستگی تتراکوریک (Tetrachoric Correlation) یک نوع خاص از همبستگی پلیکوریک است که در آن هر دو متغیر به صورت دوتایی (Dichotomous) مشاهده می‌شوند اما در پس‌زمینه فرض می‌شود که هر دو متغیر دارای توزیع نرمال پیوسته هستند. به عنوان مثال، می‌توان دو متغیر قبولی/ردی و موفقیت/عدم موفقیت را با هم مقایسه کرد.

فرمول محاسبه: فرمول محاسبه این ضریب نیز بر اساس تخمین تابع احتمال مشترک نرمال دو متغیری است و با استفاده از روش‌های آماری مانند تخمین ماکزیمم درست‌نمایی (Maximum Likelihood Estimation) محاسبه می‌شود.

مفروضات:

  1. هر دو متغیر باید به صورت دوتایی باشند.
  2. در پس‌زمینه، هر دو متغیر باید دارای توزیع نرمال پیوسته باشند.

کاربرد: این روش در بررسی پرسشنامه‌هایی که شامل پرسش‌های دوتایی (بله/خیر) است، مانند سنجش موفقیت تحصیلی و وضعیت استخدامی (استخدام/عدم استخدام) کاربرد دارد.

18. همبستگی جزئی (Partial Correlation)

همبستگی جزئی (Partial Correlation) برای اندازه‌گیری رابطه بین دو متغیر پس از حذف اثر یک یا چند متغیر دیگر استفاده می‌شود. در این روش، اثر متغیرهای دیگر از متغیرهای اصلی حذف شده و سپس همبستگی بین باقی‌مانده‌ها محاسبه می‌شود.

فرمول محاسبه: همبستگی جزئی به صورت زیر محاسبه می‌شود:

r_xy.z = (r_xy – r_xz * r_yz) / sqrt((1 – r_xz^2) * (1 – r_yz^2))

که در آن:

  • xyr = همبستگی بین x و y،
  • xzr = همبستگی بین x و z،
  • yzr = همبستگی بین y و z.

مفروضات:

  1. داده‌ها باید به صورت پیوسته و نرمال باشند.
  2. اثر متغیرهای کنترلی (مانند z) به صورت خطی باید قابل حذف باشد.

کاربرد: این روش در بررسی رابطه بین دو متغیر در حضور یک متغیر کنترل مانند اثر قد و وزن پس از حذف اثر سن یا اثر نمرات درسی پس از حذف اثر تعداد ساعات مطالعه استفاده می‌شود.

19. همبستگی چندسطحی (Multilevel Correlation)

همبستگی چندسطحی (Multilevel Correlation) نوع خاصی از همبستگی جزئی است که در آن متغیر کنترل به عنوان یک عامل تصادفی (Random Effect) در مدل مخلوط-اثرات (Mixed-Effects Model) در نظر گرفته می‌شود. این نوع همبستگی برای داده‌هایی به کار می‌رود که دارای ساختار سلسله‌مراتبی هستند، مانند داده‌های مربوط به دانش‌آموزان در مدارس مختلف.

فرمول محاسبه: فرمول همبستگی چندسطحی بر اساس مدل‌های آماری چندسطحی و روش‌های شبیه‌سازی برای محاسبه کوواریانس و واریانس در هر سطح (مانند سطح دانش‌آموز و سطح مدرسه) است.

مفروضات:

  1. داده‌ها باید دارای ساختار سلسله‌مراتبی باشند.
  2. اثر متغیرها باید به صورت سلسله‌مراتبی یا چندسطحی در مدل تعریف شود.

کاربرد: این روش برای بررسی رابطه بین نمرات ریاضی و علوم در حضور اثر مدرسه، یا بررسی اثرات مختلف درمانی در گروه‌های مختلف بیمارستان‌ها استفاده می‌شود.

20. همبستگی آنتروپی (Entropy-Based Correlation)

همبستگی آنتروپی برای اندازه گیری رابطه بین دو متغیر بر اساس عدم قطعیت یا آنتروپی آن‌ها استفاده می‌شود. این روش به جای اندازه‌گیری وابستگی خطی، از اطلاعات مشترک بین دو متغیر برای سنجش میزان همبستگی استفاده می‌کند.

فرمول محاسبه: معمولاً از فرمول اطلاعات متقابل (Mutual Information) و آنتروپی برای محاسبه همبستگی استفاده می‌شود:

I(X, Y) = H(X) + H(Y) – H(X, Y)

که در آن:

  • H(X) و H(Y) = آنتروپی متغیرهای X و Y،
  • = آنتروپی مشترک بین دو متغیر.

مفروضات:

  1. داده‌ها می توانند به صورت پیوسته یا گسسته باشند.
  2. وجود هر نوع وابستگی غیرخطی یا غیرعادی بین متغیرها را می‌توان اندازه گیری کرد.

کاربرد: این روش برای تحلیل رابطه بین متغیرهایی که دارای وابستگی‌های پیچیده و غیرمعمول هستند، مانند بررسی وابستگی غیرخطی بین میزان درآمد و الگوهای مصرف استفاده می‌شود.

اشتراک گذاری این محتوا، پلتفرم خود را انتخاب کنید!
مطالب مرتبط دیگر :

  • بهترین برنامه های همکاری در فروش سئو (Affiliate) در سال 2024
بهترین برنامه های همکاری در فروش سئو (Affiliate) در سال 2024

اکتبر 23, 2024|بدون دیدگاه

چکیده مقاله: تصور کنید می توانستید از ابزارهای سئو که به شما کمک کردند یک بازاریاب حرفه ای شوید، درآمد کسب کنید. خب، حالا می توانید! برنامه های همکاری در فروش سئو هر زمان [...]

  • لینک سازی کلاه سفید چیست؟
لینک سازی کلاه سفید چیست؟

اکتبر 15, 2024|بدون دیدگاه

چکیده مقاله: لینک سازی کلاه سفید نتایجی واقعی و ماندگار ارائه می دهد. این فرآیند کسب بک لینک های باکیفیت از طریق روش های اخلاقی است. بدون ترفند. بدون میانبرهای ناپسند. اینجا در لنسرسرا، [...]

  • پین پوینت سئو چیست؟ (Pain Point SEO)
پین پوینت سئو چیست؟ (Pain Point SEO)

اکتبر 14, 2024|بدون دیدگاه

چکیده مقاله: ترافیک وب سایت خوب است، اما اگر به فروش تبدیل نشود، چه فایده ای دارد؟ مشتریان شما به نتایج واقعی نیاز دارند که کسب و کارشان را رشد دهد. «پین پوینت سئو [...]