رگرسیون لجستیک

رگرسیون لجستیک

رگرسیون لجستیک مدل آماری رگرسیونی است برای متغیرهای وابسته دوسویی مانند بیماری یا سلامت، مرگ یا زندگی است. این مدل را به عنوان مدل خطی تعمیم یافته ای که از تابع لجیت به عنوان تابع پیوند استفاده می کند و خطایش از توزیع چندجمله ای پیروی می کند، می توان به حساب آورد. منظور از دو سویی بودن، رخداد یک واقعه تصادفی در دو موقعیت ممکنه است. به عنوان مثال خرید یا عدم خرید، ثبت نام یا عدم ثبت نام، ورشکسته شدن یا ورشکسته نشدن و … متغیرهایی هستند که فقط دارای دو موقعیت هستند و مجموع احتمال هر یک آنها در نهایت یک خواهد شد. کاربرد این روش عمدتا  در ابتدای ظهور در مورد کاربردهای پزشکی برای احتمال وقوع یک بیماری مورد استفاده قرار میگرفت. لیکن امروزه در تمام زمینه های علمی کاربرد وسیعی یافته است.

به عنوان مثال مدیر سازمانی میخواهد بداند در مشارکت یا عدم مشارکت کارمندان کدام متغیرها نقش پیش بینی دارند؟ مدیرتبلیغاتی می خواهد بداند در خرید یا عدم خرید یک محصول یا برند چه متغیرهایی مهم هستند؟ یک مرکز تحقیقات پزشکی می خواهد بداند در مبتلا شدن به بیماری عروق کرنری قلب چه متغیرهایی نقش پیش بینی کننده دارند؟ تا با اطلاع رسانی از احتمال وقوع کاسته شود. رگرسیون لجستیک می تواند یک مورد خاص از مدل خطی عمومی و رگرسیون خطی دیده شود. مدل رگرسیون لجستیک، بر اساس فرض های کاملا متفاوتی (درباره رابطه متغیرهای وابسته و مستقل) از رگرسیون خطی است. تفاوت مهم این دو مدل در دو ویژگی رگرسیون لجستیک می تواند دیده شود: اول توزیع شرطی Y│X یک توزیع برنولی به جای یک توزیع گوسی است، چونکه متغیر وابسته دودویی است دوم مقادیر پیش بینی احتمالاتی است و محدود بین بازه صفر و یک و به کمک تابع توزیع لجستیک بدست می آید رگرسیون لجستیک احتمال خروجی پیش بینی می‌کند.

این مدل به صورت زیر می باشد:

انجام آزمون Logistic Regression در نرم افزار SPSS

loading