بررسی فروض مدل رگرسیون خطی

بررسی فروض مدل رگرسیون خطیتحلیل رگرسیون مبتنی بر چند فرض اساسی و ساده می‌باشد که اگر یک یا چند مورد از این فروض برقرار نباشد، تفسیر مربوط به تحلیل رگرسیون نادرست بوده و پیش بینی‌های انجام‌شده بر اساس آن ضعیف خواهد بود. این مفروضات عبارت‌اند از: ۱) عدم ناهمسانی واریانس ۲) عدم خود همبستگی، ۳) عدم هم خطی و ۴) نرمال بودن خطاها،

(درصورتی‌که در پژوهشی از داده‌های ترکیبی استفاده شود، تنها بررسی فرض عدم ناهمسانی واریانس و عدم خودهمبستگی و عدم هم خطی کفایت می‌کند)

عدم ناهمسانی واریانس

همسان بودن واریانس جملات اخلال یکی از فروض مهم رگرسیون خطی در برآورد به روش حداقل مربعات است. در صورت نقض این فرضیه نتایج حاصل از برآورد رگرسیون ازاین‌جهت قابل‌اتکا نخواهد بود که ادعا می‌شود اگر یک نمونه دیگر با همین شرایط انتخاب شود، احتمالاً نتایج حاصل از برآورد قبلی نقض خواهد شد و همین عامل پژوهش‌گر را در تفسیر نتایج حاصل از برآورد تضعیف خواهد کرد.

باید خاطرنشان کرد که مشکل واریانس ناهمسانی در داده‌های مقطعی بیشتر بروز می‌کند و ضرورت انجام آزمون‌های متداول برای اعتماد بیشتر به نتایج حاصل از پژوهش بیش‌تر به نتایج حاصله را محرز می‌سازد. اگر ناهمسانی واریانس وجود داشته باشد، آزمون‌های تی و اف نتایج غلطی را ارائه می‌دهند و بنابراین نمی‌توان فرضیه‌ها را با آزمون‌های تی و اف آزمون کرد.

درروش داده‌های تابلویی و تلفیقی هنگامی که تعداد مقاطع بیش از دوره زمانی باشد، احتمال وجود ناهمسانی واریانس وجود خواهد داشت. اگر روش مورداستفاده اثرات تصادفی باشد، نیازی به برطرف کردن مشکل ناهمسانی واریانس نمی‌باشد. زیرا این روش به گونه‌ای عمل می‌کند که در مراحل انجام کار، مشکل ناهمسانی واریانس به‌صورت خودکار برطرف می‌شود.

اما در صورت استفاده از روش اثرات ثابت یا روش داده های تلفیقی، باید مشکل ناهمسانی واریانس برطرف شود. یکی از آزمون‌های مشهور در این زمینه آزمون بارتلت می‌باشد که نرم افزار ایویوز قابلیت انجام این آزمون را برای پژوهشگران فراهم ساخته است. همچنین برای رفع مشکل ناهمسانی واریانس در صورت وجود، روش حداقل مربعات تعمیم یافته برای تخمین مدل مورد استفاده قرار می گیرد. در ارتباط با این مشکل، متغیر های الگوی رگرسیون موزون می شوند. به همین دلیل روش مذکور حداقل مجذورات موزوننیز نامیده می شود.

عدم خود همبستگی

اصطلاح خودهمبستگی در مدل رگرسیون خطی را می‌توان چنین تعریف کرد: همبستگی سری‌های مشاهداتی که در زمان (مانند داده‌های سری زمانی) یا مکان (مانند داده‌ی مقطعی) ردیف شده‌اند. در مدل رگرسیون خطی فرض می‌شود که در اجزاء اخلال چنین خودهمبستگی وجود ندارد. به این معنی که جز اخلال مربوط به یک مشاهده، تحت تأثیر جز اخلال مربوط به مشاهدات دیگر قرار نمی‌گیرد.

زمانی که بین جملات خطا ارتباط وجود داشته باشد، مشکل خودهمبستگی بین جملات خطا پیش می‌آید که در این حالت مشکل ناکارایی تخمین زن‌های حداقل مربعات معمولی، اریب دار بودن واریانس خطاها و ضرایب مدل بروز می‌کند و آزمون‌های تی و اف معمولی نمی‌توانند جهت معنی‌داری مدل‌ها به کار گرفته شوند.

برای تشخیص خود همبستگی روش های مختلفی از جمله روش ترسیمی، آزمون دوربین-واستون و آزمون ضریب لاگرانژ وجود دارد.  از آزمون دوربین-واستونبه منظور تشخیص خود همبستگی استفاده می شود. این آزمون از مشهورترین آزمون ها جهت تشخیص خود همبستگی است.

زمانی که آماره دوربین- واتسون در محدوده ۱/۵ تا ۲/۵  باشد، معرف عدم وجود خود همبستگی است، ولی مقادیر بالاتر یا کمتر از آن معرف آن است که جملات خطا به صورت تصادفی اتفاق نمی ­افتند و بنابراین نتایج غیر واقعی است. همچنین برای رفع مشکل خود همبستگی، از روش تصحیح خود بازگشت مرتبه اول استفاده می شود.

آزمون عدم هم خطی

در آمار، عامل تورم واریانس شدت همخطی چندگانه را در تحلیل رگرسیون خطی کمترین مربعات معمولی ارزیابی می کند. در واقع یک شاخص معرفی می گردد که بیان می دارد چه مقدار از تغییرات مربوط به ضرایب برآورد شده بابت همخطی افزایش یافته است. شدت همخطی چندگانه  را با بررسی بزرگی مقدار  VIF می توان تحلیل نمود. اگر آماره آزمون VIF به یک نزدیک بود نشان دهنده عدم وجود همخطی است. به عنوان یک قاعده تجربی مقدار VIF بزرگتر از ۵ باشد همخطی چندگانه بالا می باشد (توجه شود که در برخی موارد عدد ۱۰ نیز به عنوان آستانه معرفی می گردد)

آزمون نرمال بودن خطاها

نرمال بودن توزیع جملات اخلال نیز آخرین مورد از فروض رگرسیون خطی یا همان فروض کلاسیک رگرسیون است. اگر هدف ما تنها تخمین پارامترها باشد در این صورت روش OLS کافی خواهد بود اما تأکید بر تخمین تنها یکی از جنبه‌های استنتاج آماری است و جنبهٔ دیگر آزمون فرضیه می‌باشد.

ازآنجاکه هدفمان هم تخمین پارامترها و هم آزمون فرضیه است، لذا احتیاج به تعیین توزیع احتمالی جزء اخلال ui خواهیم داشت، بنابراین فرض می‌کنیم که جملات اخلال دارای توزیع نرمال با میانگین صفر و واریانس ثابت باشد. این فرض علاوه بر اینکه در انجام آزمون فرضیه نقش ایفا می‌کند سبب می‌شود تا برآوردهای انجام‌شده از طریق OLS منطبق با برآوردهای روش حداکثر راست نمایی شود و بنابراین موجب می‌شود تا روش OLS به‌صورت مجانبی کاراترین روش در میان تخمین زننده‌های معمول باشد.

البته باید توجه داشت، درصورتی‌که تعداد داده‌های نمونه موردبررسی به‌اندازه کافی بزرگ باشد و فروض همسانی واریانس، عدم وجود خودهمبستگی و صفر بودن میانگین جملات اخلال برقرار باشد، بر طبق قضیه حد مرکزی انتظار بر این است که توزیع جملات اخلال یک توزیع نرمال باشد.

یکی از آزمون‌های مشهور در این زمینه آزمون جارکوبرا می‌باشد که نرم افزار ایویوز قابلیت انجام این آزمون را برای پژوهشگران فراهم ساخته است. زمانی که نمونه به اندازه کافی بزرگ باشد، انحراف از فرض نرمال بودن به طور معمول بی اهمیت و پیامدهای آن ناچیز است. در شرایط مذکور، با توجه به قضیه حد مرکزی می توان دریافت که حتی اگر باقیمانده ها نرمال نباشند، آماره های آزمون به طور مجانبی از توزیع نرمال پیروی می کنند، بدون تورش هستند و از کارآیی برخوردارند. با توجه به این مطالب می توان فرض نرمال بودن جمله خطا را نادیده گرفت.

دانلود جزوه آموزشی ایویوز     

دانلود ویدئو های آموزشی ایویوز     

بررسی فروض مدل رگرسیون خطی
۴.۴ (۸۸%) ۵ vote[s]

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.