تفاوت های کلیدی رگرسیون لجستیک و رگرسیون خطی

تفاوت های کلیدی رگرسیون لجستیک و رگرسیون خطی
توسط منتشر شده در : جولای 18, 2024دسته بندی: مقالات تحلیل آماریLast Updated: جولای 18, 2024بدون دیدگاه on تفاوت های کلیدی رگرسیون لجستیک و رگرسیون خطینمایش: 370

چکیده مقاله :
تحلیل رگرسیون ابزار مهمی در علوم کامپیوتر، یادگیری ماشین (ML)، هوش مصنوعی (AI) و علم داده است که رابطه بین متغیرهای وابسته و مستقل را تعیین می کند. رگرسیون لجستیک و رگرسیون خطی دو شاخه از تحلیل رگرسیون هستند. درک هر دو نوع رگرسیون می تواند به شما کمک کند از آنها به طور موثر در تحقیقات آماری، تجزیه و تحلیل داده ها و تجزیه و تحلیل پیش بینی استفاده کنید. در این مقاله رگرسیون لجستیک و رگرسیون خطی را تعریف کرده و تفاوت های کلیدی رگرسیون لجستیک و رگرسیون خطی را بررسی می کنیم.

رگرسیون لجستیک چیست؟

رگرسیون لجستیک مدلی است که احتمال وقوع یک رویداد را از ورودی یک یا چند متغیر مستقل نشان می دهد. در بیشتر موارد، رگرسیون لجستیک تنها دو خروجی تولید می‌کند که منجر به یک نتیجه باینری می‌شود. تجزیه و تحلیل لجستیک در درجه اول به نتایج باینری منجر می شود، اما این مدل رگرسیون همچنین می تواند خروجی های چند جمله ای حاوی بیش از دو متغیر تولید کند.

هنگام مدل‌سازی رگرسیون لجستیک، متغیرهای مستقل بر متغیرهای وابسته تأثیر می‌گذارند و به شما یک خروجی یا-یا می‌دهند. برخلاف رگرسیون خطی، رگرسیون لجستیک مشکلات طبقه‌بندی را اندازه‌گیری می‌کند که در آن می‌توانید خروجی‌های باینری را بر اساس اطلاعات طبقه‌بندی شناسایی کنید. هنگام محاسبه یک مدل رگرسیون لجستیک، متغیرهای مستقل می توانند چندین تمایز داشته باشند:

  • متغیرهای پیوسته مقادیر بی نهایت را نشان می دهند.
  • متغیرهای ترتیبی گسسته دارای ترتیب رتبه بندی هستند و در نقطه ای به پایان می رسند.
  • متغیرهای اسمی گسسته نیز در نقطه ای پایان می یابند اما ترتیب رتبه بندی ندارند.

رگرسیون خطی چیست؟

رگرسیون خطی یک مدل رگرسیونی است که به تعیین چگونگی تغییر مقدار متغیر وابسته بر اساس تنظیمات متغیر مستقل کمک می کند. برای ایجاد همبستگی یا رابطه بین یک متغیر وابسته و یک یا چند متغیر مستقل موثر است. در حالی که رگرسیون لجستیک به طبقه بندی مسائل محاسباتی کمک می کند، مدل های خطی خط رگرسیون یک مسئله را محاسبه می کنند. دو نوع رگرسیون خطی رگرسیون خطی ساده و رگرسیون خطی چندگانه است.

رگرسیون خطی ساده دارای یک متغیر مستقل است، در حالی که رگرسیون خطی چندگانه می تواند دو یا چند متغیر مستقل داشته باشد. یک مثال از رگرسیون خطی ساده، یک شرکت بیمه است که از سن رانندگان برای تعیین اینکه آیا آنها احتمالاً ایمن هستند یا خیر، استفاده می کند. شرکت بیمه ممکن است برای شناسایی ارتباط بین صدور بیمه نامه و سابقه اعتباری راننده، سابقه رانندگی و مسافت پیموده شده وسیله نقلیه بر رگرسیون خطی چندگانه تکیه کند.

تفاوت های کلیدی رگرسیون لجستیک و رگرسیون خطی

در اینجا چند تفاوت بین رگرسیون لجستیک و رگرسیون خطی وجود دارد:

رابطه بین متغیرها

یکی از تفاوت های کلیدی بین رگرسیون لجستیک و خطی، رابطه بین متغیرها است. رگرسیون خطی به صورت یک خط مستقیم رخ می دهد و به تحلیلگران اجازه می دهد تا نمودارها و نمودارهایی ایجاد کنند که حرکت و تغییرات روابط خطی را دنبال می کند. رگرسیون لجستیک مشکلات طبقه بندی مربوط به یک رویداد را حل می کند، بنابراین ردیابی رگرسیون لجستیک با استفاده از ساختارهای خطی غیر معمول است.

همبستگی متغیرهای مستقل

تفاوت دیگر این است که می توانید از آزمون رگرسیون خطی برای شناسایی همبستگی بین متغیرها استفاده کنید. در رگرسیون خطی ساده، امکان وجود همبستگی بین متغیرهای وابسته و مستقل وجود دارد. رگرسیون خطی چندگانه می تواند یک یا چند همبستگی ممکن بین متغیرها را پیدا کند، مانند روابط علت و معلولی. در رگرسیون لجستیک، متغیرهای مستقل هیچ همبستگی مشترکی ندارند، زیرا همه آنها مستقل از یکدیگر هستند و هیچ متغیر وابسته ای ندارند.

روش های پیش بینی

رگرسیون خطی از اعداد صحیح مثبت و منفی برای پیش بینی مقادیر استفاده می کند. شما می توانید بی نهایت احتمالات عددی را در امتداد یک خط مستقیم اعمال کنید و طیف وسیعی از مقادیر را به عنوان نتایج بدست آورید. در مقابل، رگرسیون لجستیک معمولاً فقط شامل دو نتیجه است که بین یک تا صفر متغیر است. در مواردی که تجزیه و تحلیل لجستیک منجر به خروجی های چند جمله ای می شود، تحلیلگران ممکن است طبقه بندی های باینری را برای سازماندهی داده ها در مدل های پیش بینی اعمال کنند.

ارزش وزن بعدی

رگرسیون لجستیک و خطی نیز مقدار وزن بعدی را متفاوت پیش بینی می کند. رگرسیون خطی از خطای ریشه میانگین مربع یا انحراف معیار برای پیش‌بینی نتیجه متغیرهای وابسته استفاده می‌کند. با استفاده از خطای root-mean-square، می توانید گسترش مقادیر داده ها را در سراسر خط رگرسیون اندازه گیری کنید. همچنین دقت را اندازه گیری کرده و ماتریس کوواریانس خطاها را از طریق تخمین حداکثر احتمال (MLE) مقایسه می کند.

در رگرسیون لجستیک، مقدار وزن بعدی از شکلی از محاسبه دقیق حاصل می شود. در این روش، تحلیلگران نتایج باینری را محاسبه کرده و این مقادیر را بر روی یک منحنی سیگموئید به جای یک خط ترسیم می کنند. هنگام آزمایش دقت تحلیل لجستیک، می توانید از خطای ریشه میانگین مربع برای تعیین صحت پیش بینی مدل خود استفاده کنید.

روش های فعال سازی

در یادگیری ماشینی، مدل‌سازی و آزمایش رگرسیون بر توابع فعال‌سازی مختلفی تکیه می‌کند که به شبکه هوش مصنوعی می‌گوید چه زمانی یک نورون یا عملکرد خاصی را از یک ورودی فعال کند. رگرسیون خطی به یک تابع فعال سازی نیاز ندارد، اما اگر بخواهید یک مدل رگرسیون خطی را به یک معادله رگرسیون لجستیک تبدیل کنید، یک تابع فعال سازی ضروری می شود. هنگام تبدیل مدل های خطی به محاسبات لجستیک، تابع سیگموئید برای فعال کردن شبکه های عصبی AI و ML در یک سیستم محاسباتی ضروری می شود.

روش های برآورد

روش های تخمین یکی دیگر از تفاوت های کلیدی رگرسیون لجستیک و رگرسیون خطی است. در رگرسیون خطی، شما از روش حداقل مربعات معمولی (OLS) برای تخمین معادله ای استفاده می کنید که به بهترین وجه با خط رگرسیون شما مطابقت دارد. در مقابل، رگرسیون لجستیک از روش تخمین حداکثر احتمال برای تطبیق معادلات رگرسیون با منحنی سیگموئید استفاده می کند.

کاربرد

رگرسیون خطی و رگرسیون لجستیک نیز می توانند در کاربردهایشان متفاوت باشند. حوزه هایی که رگرسیون خطی در آنها بیشتر از مدل سازی لجستیک کاربرد دارد عبارتند از:

  • بینش تجاری: مدیران می توانند از رگرسیون خطی برای درک رفتار مصرف کننده، ارزیابی روندها، پیش بینی فروش و برآورد درآمد یا زیان استفاده کنند.
    تجزیه و تحلیل بازار: کسب و کارها همچنین می توانند از رگرسیون خطی برای تجزیه و تحلیل بازار برای ارزیابی اثرات قیمت گذاری، طراحی، تبلیغات و سایر استراتژی های بازاریابی بر فروش یک محصول یا خدمات استفاده کنند.
  • ارزیابی ریسک: شرکت‌های فعال در صنعت ریسک و خدمات مالی می‌توانند از رگرسیون خطی برای ارزیابی مواجهه با ریسک و پیش‌بینی اثرات آن ریسک استفاده کنند.

بر خلاف رگرسیون خطی، رگرسیون لجستیک می تواند برای کاربردهای بسیاری از صنایع مانند:

  • مدیریت پایگاه داده: نرم افزار مدیریت پایگاه داده اغلب از رگرسیون لجستیک استفاده می کند. بسیاری از صنایع برای جمع آوری داده های آماری متنوع به مدیریت پایگاه داده در موارد رگرسیون لجستیک متکی هستند.
    امتیازدهی اعتبار: رگرسیون لجستیک می تواند به ایجاد مدل های پیش بینی برای امتیازدهی خودکار اعتبار کمک کند. هنگام محاسبه امتیازات اعتباری، سازمان ها چندین متغیر را در نظر می گیرند و مدل های رگرسیون لجستیک را برای پیش بینی های سریع تر و دقیق تر موثر می کنند.
  • ردیابی رفتار مشتری: مدل های یادگیری ماشینی از رگرسیون لجستیک در فروشگاه های آنلاین بزرگ، پلتفرم های رسانه های اجتماعی، بازی های ویدیویی و سیستم های مدیریت محتوا استفاده می کنند. این سیستم بصری، خودآموز و سریع است که به خودکارسازی عملکردها و افزایش تجربه مشتری کمک می کند.
  • رزرو محل اقامت: وب سایت های رزرو هتل از رگرسیون لجستیک برای پیش بینی مقاصد بازدیدکنندگان و توصیه مقاصد تعطیلات و گزینه های اقامت استفاده می کنند. این مدل از داده های تاریخی در مورد نحوه تعامل کاربران با سایت ها استفاده می کند و به طور بالقوه شانس رزرو هتل خاصی را برای سفر بعدی خود افزایش می دهد.
  • ویرایش متن: بسیاری از ابزارهای محبوب ویرایش متن آنلاین از مدل‌های رگرسیون لجستیک برای شناسایی خطاهای گرامری، اشتباهات تایپی، نحوی و اشتباهات ساختاری استفاده می‌کنند. آنها همچنین می توانند این الگوریتم ها را برای شناسایی و پرچم گذاری زبان های توهین آمیز و سایر مقوله ها، بسته به برنامه کاربر و ویژگی های نرم افزار، آموزش دهند.

تفاوت محاسبه رگرسیون خطی و رگرسیون لجستیک

در یادگیری ماشین، رگرسیون خطی و رگرسیون لجستیک شامل فرآیندهای یادگیری نظارت شده است که برنامه نویسان از آن برای توسعه سیستم های تعاملی و پاسخگو استفاده می کنند. هنگام محاسبه رگرسیون خطی، می توانید یک خط رگرسیون را محاسبه کنید که رابطه پیش بینی بین ورودی تصادفی و خروجی مورد نظر را نشان می دهد. برعکس، رگرسیون لجستیک می تواند بینشی در مورد مشکلات طبقه بندی به شما بدهد. در این بخش، تفاوت های کلیدی رگرسیون لجستیک و رگرسیون خطی، نحوه محاسبه هر دو نوع رگرسیون و زمان تبدیل خطی به رگرسیون لجستیک را بررسی می‌کنیم.

هر دو مدل رگرسیون خطی و لجستیک برای تحلیل رگرسیون در طیف وسیعی از کاربردها ضروری هستند. علاوه بر این، رگرسیون لجستیک به خط رگرسیونی که شما از یک مدل خطی به دست می آورید، متکی است تا نتایج باینری آن را به دست آورد. با این حال، هنگام محاسبه این دو مقدار تفاوت هایی وجود دارد. از مراحل زیر برای محاسبه رگرسیون خطی و رگرسیون لجستیک استفاده کنید و ببینید که چگونه این دو مدل با یکدیگر همبستگی دارند:

نحوه محاسبه رگرسیون خطی

از آنجایی که مدل های رگرسیون خطی از خطوط برای نمایش نرخ تغییر و روابط آماری بین ورودی ها و خروجی ها استفاده می کنند، این مدل از یک معادله خطی استفاده می کند. برای استخراج مقادیر رگرسیون خطی، می توانید از فرمول استفاده کنید:

Y(x) = mx + C

در فرمول، “Y” یک متغیر وابسته و تابعی از “x” است که نشان دهنده متغیر مستقل یا توضیحی است. می توانید از مراحل زیر برای اعمال فرمول محاسبه رگرسیون خطی استفاده کنید:

  1. مقادیر ورودی x را تعیین کنید. هنگام ساخت مدل رگرسیون خطی، اجازه دهید x مقدار ورودی را نشان دهد. به عنوان مثال، اگر یک توسعه‌دهنده نرم‌افزار خروجی خاصی را بخواهد (Y در معادله)، از متغیر x برای نمایش مقدار ورودی استفاده می‌کند، مانند وارد کردن کد خاصی که به سیستم می‌گوید یک خروجی عملکردی تولید کند.
  2. گرادیان را به مقدار m اختصاص دهید. مقدار گرادیان نشان دهنده شیب خط مدل رگرسیون است و نرخ تغییر متغیر وابسته بر اساس متغیر مستقل را اندازه گیری می کند.
  3. ثابت را جایگزین C کنید. متغیر C مقدار ثابتی در الگوریتم شما است که در سراسر مدل رگرسیون خطی ثابت می ماند. در یادگیری ماشین، یک ثابت می تواند مقادیر پیش بینی کننده باشد که برنامه نویسان برای دستیابی به خروجی هنگام محاسبه رگرسیون خطی با ورودی های مختلف استفاده می کنند.
  4. معادله رگرسیون خطی را محاسبه کنید. هنگامی که متغیرها و مقادیر پیش بینی خود را دارید، می توانید کل معادله را محاسبه کنید تا مدل رگرسیون خطی را پیدا کنید، که یک خط مستقیم به شما می دهد. با استفاده از این اطلاعات، برنامه نویسانی که سیستم های یادگیری ماشینی را توسعه و طراحی می کنند، می توانند عملکرد، فعال سازی و کارایی یادگیری تحت نظارت شبکه های مختلف هوش مصنوعی را تجزیه و تحلیل کنند.

نحوه محاسبه مدل های رگرسیون لجستیک

رگرسیون لجستیک بر تعیین آستانه احتمالی تمرکز دارد که محدوده معقولی را که متغیرهای وابسته می توانند نشان دهند، دیکته می کند. از آنجایی که تحلیل رگرسیون لجستیک نتایج باینری می دهد، معادله محاسبه این مقدار با معادلات رگرسیون خطی و فرآیندهای محاسباتی متفاوت است.

برای محاسبه رگرسیون لجستیک می توانید از معادله سیگموئید استفاده کنید:

S(x) = 1 / (1 + e-x)

در این فرمول x نشان دهنده مقدار ورودی است و متغیر S تابعی از x است. مقدار e نشان دهنده مقدار خطای پیش بینی است که روش میانگین مربعات رگرسیون خطی هنگام تعیین دقت تجزیه و تحلیل پیش بینی استفاده می کند. برای محاسبه رگرسیون لجستیک از مدل رگرسیون خطی، از مراحل زیر برای اعمال فرمول استفاده کنید:

  1. از خط رگرسیون مدل خطی استفاده کنید. هنگامی که یک خط رگرسیون را محاسبه می کنید، می توانید این مقدار پیش بینی را به یک مدل رگرسیون لجستیک تبدیل کنید که یک نتیجه احتمالی بین صفر و یک ارائه می دهد.
  2. مقادیر رگرسیون خطی را به تابع سیگموئید اختصاص دهید. با استفاده از مقدار x و خطای باقیمانده (e) از مدل رگرسیون خطی خود، این مقادیر را به معادله سیگموئید متصل کنید.
  3. مقدار سیگموئید را به یک یا صفر تبدیل کنید. هنگامی که مقدار رگرسیون لجستیک را از تابع سیگموئید استخراج کردید، بسته به جایی که مقدار در منحنی S ظاهر می شود، می توانید این مقدار را به یک یا صفر تبدیل کنید. به عنوان مثال، اگر رگرسیون لجستیک به مقدار 0.78 منجر شود، می توانید آن را به یک تبدیل کنید تا نزدیک ترین مقدار گسسته را نشان دهد.

زمان تبدیل رگرسیون خطی به لجستیک

تبدیل یک مدل خطی به یک مدل رگرسیون لجستیک می تواند هنگام اعمال طبقه بندی باینری برای مجموعه داده های نمونه ضروری باشد. طبقه بندی باینری زمانی اتفاق می افتد که پارامتری را برای طبقه بندی داده های نمونه به دو دسته مجزا ایجاد می کنید. در یادگیری ماشین نظارت شده، تبدیل رگرسیون خطی به رگرسیون لجستیک برای حل مسائل طبقه بندی هنگام تجزیه و تحلیل خطای باقیمانده یک خط رگرسیون ضروری است. چندین مورد دیگر را در نظر بگیرید که برای تبدیل رگرسیون خطی به لجستیک قابل استفاده است:

  • ارزیابی نسبت سود به زیان در فروش
  • تجزیه و تحلیل اثرات بر علائم در طول مطالعات دارویی
  • اندازه گیری نرخ ریزش مشتری در بازاریابی
اشتراک گذاری این محتوا، پلتفرم خود را انتخاب کنید!
مطالب مرتبط دیگر :

  • رگرسیون لجستیک (logistic regression) چیست؟
رگرسیون لجستیک (logistic regression) چیست؟

اکتبر 4, 2024|بدون دیدگاه

چکیده مقاله:رگرسیون لجستیک احتمال وقوع یک رویداد، مانند رای دادن یا رای ندادن، را بر اساس یک مجموعه داده از متغیرهای مستقل تخمین می‌زند. این نوع مدل آماری (که به آن مدل لاجیت نیز گفته [...]

  • الگوریتم خفاش (Bat Algorithm) چیست؟
الگوریتم خفاش (Bat Algorithm) چیست؟

اکتبر 3, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم خفاش (Bat Algorithm) یک الگوریتم فراابتکاری مبتنی بر جمعیت است که برای حل مسائل بهینه سازی پیوسته استفاده می شود. این الگوریتم برای بهینه سازی راه حل ها در رایانش ابری، [...]

  • الگوریتم کرم شب تاب چیست؟
الگوریتم کرم شب تاب چیست؟

اکتبر 3, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم کرم شب تاب چیست؟ الگوریتم های الهام گرفته از زیست، که به عنوان الگوریتم های الهام گرفته از طبیعت یا الگوریتم های تکاملی نیز شناخته می شوند، تکنیک های محاسباتی هستند [...]

  • آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال
آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال

سپتامبر 30, 2024|بدون دیدگاه

چکیده مقاله: آزمون فریدمن ابزاری آماری برای مقایسه نمونه‌ها یا اندازه‌گیری‌های مکرر است زمانی که مفروضات پارامتریک برآورده نمی‌شوند. در واقع آزمون فریدمن توسعه‌ای از آزمون Wilcoxon signed-rank test و آنالوگ ناپارامتری از اندازه‌گیری [...]

  • برنامه نویسی فرانت اند: راهنمای جامع توسعه فرانت اند
برنامه نویسی فرانت اند: راهنمای جامع توسعه فرانت اند

سپتامبر 27, 2024|بدون دیدگاه

چکیده مقاله: اگر بخواهیم فرانت اند (Front-end) یا با اسم های دیگر سمت مشتری یا سمت کاربر را توضیح دهیم بهتر است بدانید که توسعه دهنده فرانت اند (Front-End Developer) به کمک زبان های برنامه [...]

  • برنامه نویسی تحت وب چیست؟ انواع، کاربرد و عملکرد
برنامه نویسی تحت وب چیست؟ انواع، کاربرد و عملکرد

سپتامبر 24, 2024|بدون دیدگاه

چکیده مقاله: امروزه تصور جهانی بدون اینترنت و وب سایت‌ها تقریباً غیرممکن است. در سال‌های اخیر، تقاضا برای برنامه نویسان وب حرفه‌ای به طور چشمگیری افزایش یافته است، بنابراین می توانید انواع کارشناسان این [...]