هم خطی چندگانه و رگرسیون لجستیک

پایان نامه
چکیده

رگرسیون لجستیک چندگانه با متغیرهای توضیحی به هم وابسته در دامنه وسیعی از علوم از جمله علوم اجتماعی، اقتصادی، مهندسی، کشاورزی و پزشکی کاربرد دارد. در مدل رگرسیون لجستیک چندگانه اگر متغیرهای توضیح دهنده وابسته باشند، آن گاه مدل ناپایدار شده و برآورد پارامترهای مدل، بسیار نادقیق می شود و حتی ممکن است تفسیر رابطه بین متغیر پاسخ و هر متغیر توضیح دهنده با استفاده از نسبت های بخت نادرست باشد. از طرفی افزایش تعداد متغیرهای توضیح دهنده موجب وجود همبستگی بین متغیرها می شود و لذا محققین برای رفع این مشکلات روش هایی را پیشنهاد می دهند. در این پایان نامه تعدادی از این روش ها بررسی می شوند. یکی از این روش ها به کارگیری یک کلاس از برآوردگرهای مولفه اصلی برای رگرسیون لجستیک است که بر اساس پارامتر مقیاس ?، تعریف می شود. این پارامتر، طیفی از متغیرهای توضیح دهنده استاندارد شده را ایجاد می کند. تعمیم روش حداقل مربعات جزیی به رگرسیون لجستیک چندگانه یک راه حل دیگر برای این مشکلات است. در این حالت متغیرهای ناهمبسته (مولفه های حداقل مربعات جزیی) به وسیله ترکیبات خطی خاص از متغیرهای توضیح دهنده اصلی، به دست می آیند. سپس آن ها را به عنوان متغیرهای توضیح دهنده جدید در مدل به کار می بریم. همچنین استفاده از برآوردگرهای ریج و استاین در رگرسیون لجستیک کاهش اثر هم خطی چندگانه در برآورد پارامترهای مدل را نتیجه می دهد.

منابع مشابه

هم خطی چندگانه در مدل های رگرسیون خطی فازی با ورودی و خروجی فازی

رگرسیون برای بررسی رابطه ی بین دو یا چند متغیر استفاده می شود، به طوری که یک متغیر را می توان از روی یک متغیر دیگر یا از روی چند متغیر پیش بینی نمود. زمانی که متغیرهای مشاهده شده مبهم باشند و یا رابطه ی بین متغیرها نادقیق باشد از رگرسیون فازی استفاده می شود. اگر چه رگرسیون فازی کاربرد وسیعی برای حل بسیاری از مسائل دارد، اما مشکل هم خطی چندگانه به عنوان یک نقص در رگرسیون فازی محسوب می شود. وجود ...

15 صفحه اول

مقایسه مدل بهینه رگرسیون لجستیک چندگانه و باینری برای رتبه‌بندی اعتباری مشتریان حقیقی بانک رفاه کارگران

یکی از وظایف اصلی موسسات مالی در حمایت از فعالان اقتصادی، اعطای تسهیلات و انجام تعهدات آنان است. پیش‌بینی ریسک‌ اعتباری ناشی از اعطای تسهیلات و در نتیجه مدیریت این ریسک از مهم‌ترین چالش‌های پیش‌روی بانک‌ها و موسسات مالی است. هدف اصلی در این کار تهیه مدل بهینه لجستیک جهت تعیین اعتبار مشتریان حقیقی با بررسی نقش تعداد رده‌های اعتبار مشتری از دو رده خوش‌حساب و بدحساب تا چهار رده خوش‌حساب، سررسیدشده...

متن کامل

به کارگیری متغیرهای پنهان در مدل رگرسیون لجستیک برای حذف اثر هم خطی چندگانه در تحلیل برخی عوامل مرتبط با سرطان پستان

مقدمه و اهداف: رگرسیون لجستیک یکی از کاربردی ترین مدل های خطی تعمیم یافته برای تحلیل رابطه ی یک یا چند متغیر توضیحی بر متغیر پاسخ رسته ای است. زمانی که بین متغیرهای توضیحی همبستگی های نسبتا قوی وجود داشته باشد هم خطی چندگانه ایجاد شده، ممکن است به کاهش کارآیی مدل منجر شود. هدف این تحقیق استفاده از متغیرهای پنهان برای کاهش اثر هم خطی چندگانه در تحلیل یک مطالعه مورد ـ شاهدی است.روش کار: داده های ...

متن کامل

بررسی کارایی برآوردگرهای تقریبا نااریب در مدل رگرسیون خطی، در حضور هم خطی چندگانه

برآوردگر حداقل مربعات معمولی (ols) ? ?=?(x^ x)?^(-1) xy اغلب برای برآورد ضرایب رگرسیونی در مدل رگرسیون خطی y=x?+? استفاده می شود. اما این برآوردگر به شدت به خصوصیات ماتریس x^ x بستگی دارد. هم خطی چندگانه بین متغیرهای توضیحی در مدل رگرسیون خطی، یک مسأله مهم در بکارگیری این مدل می باشد. در این حالت برآوردکننده کمترین مربعات (? ?) دارای واریانس بزرگی است. در این پایان نامه، ابتدا با الهام از کلاس ...

15 صفحه اول

داده کاوی، آماری؛ ترکیب رگرسیون لجستیک چندگانه با درخت تصمیم

داده کاوی یک شیوه نوین برای استخراج اطلاعات در فرایند تصمیم گیری های علمی است و اغلب از روشهای آماری و یادگیری ماشین برای تجزیه و تحلیل داده ها استفاده مینماید. یک رویکرد جدید رد این راستا ترکیب شیوه های آماری و یادگیری ماشین برای کسب اطلاعات بیشتر از استفاده جداگانه هر یک میباشد. در این پایان نامه فرایند داده کاوی رگرسیون لجستیک و درختهای تصمیم معرفی میشوند و با ترکیب cart یکی از الگوریتمهای د...

15 صفحه اول

مقایسه کاربرد شبکه عصبی مصنوعی، درخت تصمیم، رگرسیون مؤلفه‌های اصلی و رگرسیون خطی چندگانه جهت مدل‌سازی شاخص کیفیت هوای شهری

شاخص کیفیت هوا ابزار کلیدی جهت آگاهی از کیفیت هوا، نحوۀ اثر آلودگی هوا بر سلامت و روش‌های محافظتی در برابر آلودگی هوا است. هدف اصلی این تحقیق مدل‌سازی و برآورد شاخص کیفیت هوا از طریق شبکه عصبی مصنوعی، درخت تصمیم، رگرسیون خطی چندگانه و رگرسیون مؤلفه‌های اصلی است. جهت محاسبه شاخص کیفیت هوا از داده‌های هواشناسی و آلودگی هوای ثبت شده در ایستگاه تجریش و قلهک شهر تهران در دوره زمانی 1385 تا 1390 استف...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023