رگرسیون چندگانه چیست؟ فرمول، مثال‌ و سوالات متداول

رگرسیون چندگانه چیست؟ فرمول، مثال‌ و سوالات متداول
توسط منتشر شده در : آگوست 6, 2024دسته بندی: مقالات تحلیل آماریLast Updated: آگوست 6, 2024بدون دیدگاه on رگرسیون چندگانه چیست؟ فرمول، مثال‌ و سوالات متداولنمایش: 653

چکیده مقاله :
محاسبات ریاضی مانند محاسباتی که در تحلیل رگرسیون استفاده می شود می تواند به شما در پیش بینی نتایج آینده در صنایع مختلف کمک کند. تجزیه و تحلیل آماری داده ها اغلب هم برای کسب و کارها و هم برای مؤسساتی که قصد دارند برای همه احتمالات آماده باشند مفید است. رگرسیون چندگانه یک تکنیک آماری خاص است که می تواند به افراد در درک رابطه بین یک متغیر وابسته و دو یا چند متغیر مستقل کمک کند. در این مقاله توضیح می‌دهیم که رگرسیون چندگانه چیست، فرمول و مثال‌هایی ارائه می‌کنیم و کاربردهای آن و سؤالات متداول در مورد مدل رگرسیون خطی چندگانه را مورد بحث قرار می‌دهیم.

رگرسیون چندگانه چیست؟

رگرسیون چندگانه، همچنین به عنوان رگرسیون خطی چندگانه (MLR) شناخته می شود، یک تکنیک آماری است که از دو یا چند متغیر توضیحی برای پیش بینی نتیجه یک متغیر پاسخ استفاده می کند. می تواند رابطه بین چند متغیر مستقل را در برابر یک متغیر وابسته توضیح دهد. این متغیرهای مستقل به عنوان متغیرهای پیش بینی کننده عمل می کنند، در حالی که متغیر وابسته به عنوان متغیر معیار عمل می کند. شما می توانید از این تکنیک در زمینه ها، مطالعات و رشته های مختلف از جمله در اقتصاد سنجی و استنتاج مالی استفاده کنید.

تفاوت رگرسیون چندگانه و رگرسیون خطی

این شکل از تحلیل رگرسیون بر اساس رگرسیون خطی، که ساده ترین شکل رگرسیون است، گسترش می یابد. رگرسیون خطی ساده روابط ریاضی خطی بین یک متغیر مستقل و یک متغیر وابسته ایجاد می‌کند که با y = a + ßx نشان داده می‌شود، که در آن y تنها می‌تواند به یک نتیجه بر اساس متغیر x منجر شود. به عنوان مثال، در معادله 20 + 2x، که در آن x = 5 است y تنها می تواند 30 باشد.

فرمول رگرسیون خطی چندگانه

در اینجا فرمول رگرسیون خطی چندگانه وجود دارد که محاسبات خاص تری را ایجاد می کند:

y = ß0 + ß1×1 + ß2×2 + … + ßpxp

متغیرهای این معادله عبارتند از:

  • y مقدار پیش بینی شده یا مورد انتظار متغیر وابسته است.
  • x1، x2 و xp سه متغیر مستقل یا پیش بینی کننده هستند.
  • ß0 مقدار y زمانی است که همه متغیرهای مستقل برابر با صفر باشند.
  • ß1، ß2 و ßp ضرایب رگرسیون برآورد شده هستند. هر ضریب رگرسیون نشان دهنده تغییر در y نسبت به تغییر یک واحدی در متغیر مستقل مربوطه است.

به دلیل متغیرهای متعدد، که می‌توانند خطی یا غیرخطی باشند، این مدل تحلیل رگرسیون اجازه می‌دهد تا واریانس و دقت بیشتری در پیش‌بینی نتایج و درک تأثیر هر متغیر توضیحی بر واریانس کل مدل به میان آید.

مفروضات رگرسیون چندگانه

در تحلیل رگرسیون چندگانه، چندین فرض وجود دارد که نتایج معتبر و قابل اعتماد باشند. این مفروضات به شرح زیر است:

خطی بودن

یکی از مهمترین مفروضات رگرسیون چندگانه این است که یک رابطه خطی بین متغیرهای مستقل و متغیر وابسته وجود دارد. این بدان معناست که انتظار می رود رابطه بین متغیرها یک خط مستقیم باشد و منحنی یا غیرخطی نباشد. اگر رابطه خطی نباشد، نتایج تحلیل رگرسیون ممکن است غیر قابل اعتماد باشد.

استقلال

فرض دیگر رگرسیون چندگانه این است که مشاهدات مستقل از یکدیگر هستند. این بدان معنی است که مقادیر متغیر مستقل بر مقادیر متغیرهای وابسته تأثیر نمی گذارد. هر مشاهده مستقل از همه مشاهدات دیگر است.

واریانس همسانی

همسانی به این معنی است که واریانس خطاها در تمام سطوح متغیرهای مستقل ثابت است. این فرض مهم است زیرا تضمین می کند که باقیمانده های مدل، که تفاوت بین مقادیر پیش بینی شده و واقعی هستند، دارای واریانس مساوی هستند. هنگامی که این فرض برآورده نمی شود، مدل دارای ناهمسانی است، که می تواند منجر به برآوردهای مغرضانه یا ناکارآمد شود.

عادی بودن

خطاهای مدل رگرسیون معمولاً توزیع می شوند. نرمال بودن به این معنی است که خطاها از یک منحنی زنگوله شکل حول صفر پیروی می کنند و بیشتر خطاها نزدیک به صفر هستند. نرمال بودن مهم است زیرا کمک می کند تا اطمینان حاصل شود که نتایج تحلیل رگرسیون قابل اعتماد و بی طرف هستند.

چند خطی

چند خطی زمانی اتفاق می افتد که دو یا چند متغیر مستقل با یکدیگر همبستگی بالایی داشته باشند. این می تواند منجر به مشکلاتی در تحلیل رگرسیون چندگانه شود، زیرا تعیین تأثیر متغیر مستقل بر متغیر وابسته می تواند دشوار باشد. علاوه بر این، چند خطی می تواند باعث بی ثباتی در ضرایب رگرسیون شود و تفسیر نتایج تجزیه و تحلیل را دشوار می کند.

5 مثال رگرسیون چندگانه

در اینجا چند نمونه از نحوه استفاده از تحلیل رگرسیون چندگانه در حرفه شما آورده شده است:

1. نمونه املاک و مستغلات

شما یک کارمند املاک و مستغلات هستید که می خواهید مدلی ایجاد کنید تا به پیش بینی بهترین زمان برای فروش خانه کمک کند. شما امیدوارید که خانه ها را با حداکثر قیمت فروش بفروشید، اما عوامل متعددی می تواند بر قیمت فروش تاثیر بگذارد. این متغیرها شامل سن خانه، ارزش خانه‌های دیگر در محله، اندازه‌گیری‌های کمی سیستم مدارس دولتی با توجه به عملکرد دانش‌آموزان و تعداد پارک‌های مجاور، از جمله عوامل دیگر است.

شما می توانید با استفاده از این چهار متغیر مستقل یک مدل پیش بینی بسازید تا حداکثر قیمت فروش خانه ها را پیش بینی کنید. اگر هر یک از این عوامل بر حسب مقادیر ضرایبشان تغییر کرد، می توانید متغیرها را تنظیم کنید.

2. مثال تجاری

شما صاحب سهام یک شرکت سهامی عام هستید و می خواهید بدانید که آیا اکنون زمان خوبی برای فروش سهام خود است یا خیر. چندین متغیر ممکن است بر ارزش قیمت سهام تأثیر بگذارد، از جمله سودآوری شرکت، هزینه های شرکت، رقابت شرکت و دارایی های شرکت. می‌توانید از روی این چهار متغیر مستقل یک مدل پیش‌بینی بسازید تا تصمیم بگیرید که آیا سهام را فوراً بفروشید یا به حفظ سهام ادامه دهید.

3. نمونه بهداشت عمومی

شما یک اپیدمیولوژیست هستید که در حال مطالعه شیوع یک بیماری عفونی هستید. شما می خواهید گسترش آینده این بیماری را بر اساس عفونت های شناخته شده فعلی پیش بینی کنید. متغیرهای مستقل چندگانه می‌توانند بر تعداد عفونت‌های آینده تأثیر بگذارند، از جمله اندازه جمعیت، تراکم جمعیت، دمای هوا، ناقل‌های بدون علامت و اینکه آیا جمعیت به ایمنی گله‌ای دست یافته است. می‌توانید مدل‌سازی آماری و تحلیل رگرسیون خطی چندگانه را بر روی داده‌های تجربی برای پیش‌بینی نتیجه حسابداری برای تغییرات بالقوه در مقادیر ضرایب متغیرهای پیش‌بینی‌کننده انجام دهید.

4. مثال ورزشی

شما ورزشکاری هستید که به توانایی خود برای برتری و موفقیت در مسابقات اعتقاد زیادی دارید. شما معتقدید به دلیل اعتماد به نفس بالایی که دارید در رقابت بهتر عمل می کنید. سایر ورزشکاران با طرز فکر مشابه نیز عقاید مشابهی دارند. چندین متغیر مستقل ممکن است بر عملکرد ورزشی تأثیر بگذارند، از جمله اعتماد به نفس، جنس، سن، تجربه و تمایل به ریسک کردن در رقابت. محققان می توانند مطالعه گسترده تری را برای پیش بینی اینکه چگونه تغییر در هر یک از این متغیرها ممکن است بر عملکرد یک ورزشکار تأثیر بگذارد، انجام دهند.

5. نمونه مراقبت های بهداشتی

شما یک آمارشناس زیستی هستید که یک مطالعه پزشکی انجام می دهید. شما می خواهید راهی برای پیش بینی قد کودک در آینده ایجاد کنید. چندین متغیر مستقل می توانند بر رشد کودک تأثیر بگذارند، از جمله عوامل محیطی و تغذیه کودک. شما می توانید یک تحلیل خطی چندگانه برای پیش بینی قد کودک در آینده تحت سناریویی از مقادیر ضرایب این متغیرها انجام دهید.

تفسیر نتایج رگرسیون چندگانه

تفسیر نتایج تحلیل رگرسیون چندگانه شامل درک ضرایب، مقدار R-squared و اهمیت مدل و ضرایب فردی است. در اینجا چند نکته کلیدی وجود دارد که باید هنگام تفسیر نتایج رگرسیون چندگانه مورد توجه قرار گیرد:

ضرایب

ضرایب در یک مدل رگرسیون چندگانه نشان دهنده تغییر در متغیر وابسته به ازای هر یک واحد افزایش در متغیر مستقل است و بقیه متغیرها را ثابت نگه می دارد. ضریب مثبت نشان دهنده رابطه مثبت بین متغیر مستقل و متغیر وابسته است در حالی که ضریب منفی نشان دهنده رابطه منفی است. اندازه ضریب نشان دهنده قدرت رابطه است.

R-squared

مقدار R-squared اندازه‌گیری است که نشان می‌دهد متغیرهای مستقل در مدل چقدر تغییرپذیری در متغیر وابسته را توضیح می‌دهند. از 0 تا 1 متغیر است و مقادیر بالاتر نشان دهنده تناسب بهتر است. مقدار R-squared بالا لزوماً به این معنی نیست که مدل مناسب است، زیرا موارد پرت یا برازش بیش از حد می تواند بر آن تأثیر بگذارد.

اهمیت

اهمیت مدل و ضرایب فردی توسط مقادیر p آنها تعیین می شود. مقدار p کمتر از 0.05 نشان می دهد که نتیجه از نظر آماری معنی دار است، به این معنی که بعید است به طور تصادفی رخ داده باشد. در نظر گرفتن اندازه اثر و اهمیت آماری مهم است.

فاصله اطمینان

فواصل اطمینان طیفی از مقادیر را ارائه می دهند که انتظار می رود ارزش جمعیت واقعی با درجه خاصی از اطمینان در داخل آنها قرار گیرد. فاصله اطمینان بیشتر نشان دهنده عدم قطعیت بیشتر در برآورد است.

باقیمانده ها

باقیمانده ها تفاوت بین مقادیر پیش بینی شده و واقعی متغیر وابسته هستند. باقیمانده ها معمولاً توزیع می شوند و به طور تصادفی در اطراف صفر پراکنده می شوند. اگر باقیمانده ها یک الگو را نشان دهند یا به طور معمول توزیع نشده باشند، ممکن است نشان دهد که مدل مناسب برای داده ها نیست.

سوالات متداول

تفاوت بین تکنیک های رگرسیون خطی ساده و چندگانه چیست؟

همانطور که در بالا ذکر شد، روش خطی ساده یک متغیر مستقل را در برابر یک متغیر وابسته اندازه گیری می کند. تکنیک خطی چندگانه زمانی مفید است که حداقل دو متغیر مستقل در برابر یک متغیر وابسته وجود داشته باشد. از نظر ساختاری، تکنیک رگرسیون خطی چندگانه از نظر دامنه بزرگتر از تکنیک خطی ساده است. همچنین این مدل خاص تر است.

چه زمانی می توان از رگرسیون چندگانه استفاده کرد؟

هر زمان که سه یا چند متغیر اندازه گیری برای ارزیابی دارید، می توانید از تحلیل رگرسیون خطی چندگانه استفاده کنید. یکی از متغیرهای اندازه گیری، متغیر وابسته است که به آن متغیر y نیز می گویند. بقیه متغیرها متغیرهای مستقل هستند که با نام متغیر x نیز شناخته می شوند.

هدف از رگرسیون خطی چندگانه چیست؟

هدف از استفاده از این تکنیک آماری یافتن معادله ای است که بتواند متغیر y را به عنوان تابعی خطی از متغیرهای x پیش بینی کند. این می‌تواند به شما کمک کند برای آینده برنامه‌ریزی کنید یا برای چندین احتمال آماده باشید. کسب و کارها می توانند از این روش برای کمک به ارزیابی چشم انداز بلندمدت خود استفاده کنند. سایر کارمندان می توانند از این روش برای ایجاد پیش بینی های تحقیقاتی استفاده کنند.

آیا استفاده از رگرسیون خطی چندگانه ضرری دارد؟

اگر تجزیه و تحلیل رگرسیون شامل دو متغیر مستقل باشد که بسیار مشابه هستند یا به عنوان همبسته در نظر گرفته می شوند، استفاده از این تکنیک می تواند ضرری داشته باشد. این وضعیت ممکن است چند خطی بودن را نشان دهد، که زمانی رخ می دهد که دو متغیر توضیحی یک رابطه خطی قوی داشته باشند که ممکن است ضرایب را متورم کند و مشکلاتی را در تحلیل شما ایجاد کند. این مثال را در نظر بگیرید:

هدف یک کارمند پزشکی پیش بینی فشار خون فرد با استفاده از وزن و رژیم غذایی به عنوان تنها متغیرهای پیش بینی کننده است. این متغیرها برای پیش بینی فشار خون بالا به طور قابل ملاحظه ای مشابه هستند و شباهت ممکن است خطاهای استاندارد ضرایب را افزایش دهد و نیاز به تجدید نظر در مدل رگرسیون داشته باشد. حذف یک عبارت اضافی از مدل رگرسیون یا استفاده از تکنیک های پیشرفته تر می تواند به غلبه بر چالش چند خطی کمک کند.

چگونه رگرسیون خطی چندگانه را تجسم می کنید؟

یک مدل گرافیکی از رگرسیون خطی ساده، یک خط منفرد را نشان می‌دهد که از نقاط داده عبور می‌کند که به بهترین وجه رابطه بین مقادیر شیب و عبارات موجود در امتداد y را نشان می‌دهد. با رگرسیون خطی چندگانه، بیش از یک خط وجود دارد یعنی برای هر متغیر مستقل یک عدد. با استفاده از فرمول رگرسیون خطی چندگانه:

y = ß0 + ß1×1 + ß2×2 + … + ßpxp

در جایی که x1، x2 و xp سه متغیر مستقل هستند، یک نمودار سه شیب را برای تفسیر نشان می‌دهد. برای مثال در نمودار پراکندگی زیر که یک رگرسیون خطی ساده را نشان می دهد، می توانید دو خط اضافی را در یک مدل رگرسیون چندگانه تصور کنید.

اشتراک گذاری این محتوا، پلتفرم خود را انتخاب کنید!
مطالب مرتبط دیگر :

  • آنالیز واریانس (ANOVA) چیست؟ انواع، کاربرد و فرمول
آنالیز واریانس (ANOVA) چیست؟ انواع، کاربرد و فرمول

دسامبر 23, 2024|بدون دیدگاه

چکیده مقاله: ANOVA، که مخفف آنالیز واریانس است، یک روش آماری است که برای بررسی تفاوت های معنادار بین میانگین های سه یا چند گروه غیرمرتبط استفاده می شود. این تکنیک به ویژه زمانی [...]

  • برنامه نویسی شی گرا چیست؟ همراه با کد آموزشی
برنامه نویسی شی گرا چیست؟ همراه با کد آموزشی

دسامبر 18, 2024|بدون دیدگاه

چکیده مقاله: برنامه نویسی شی گرا (Object-Oriented Programming) یکی از محبوب ترین و موثرترین روش های طراحی و توسعه نرم افزار می باشد. این پارادایم بر اساس مفاهیمی مانند اشیا (Objects)، کلاس ها (Classes)، [...]

  • ضریب توافق کاپا (Kappa coefficient) چیست؟
ضریب توافق کاپا (Kappa coefficient) چیست؟

دسامبر 13, 2024|بدون دیدگاه

چکیده مقاله: ضریب توافق کاپا (Cohen's Kappa) یکی از معیارهای آماری مهم برای ارزیابی میزان توافق میان ارزیاب ها یا ابزارهای اندازه گیری مختلف است. این ضریب به ویژه زمانی به کار می رود [...]