تعیین براورد پارامترهای معادله های براوردساز تعمیم یافته در حضور داده های گمشده

پایان نامه
چکیده

برای پاسخ به بسیاری از پرسش های علمی، نیاز به گرداوری داده ها است و گرداوری داده ها به تنهایی پاسخ گوی بسیاری از پرسش ها نیست. بنابراین امروزه تحلیل داده ها در تمام شاخه های علمی امری ضروری به شمار می آید. طی چند دهه ی اخیر تحلیل داده های رده بندی در حوزه های آمار رسمی و علوم پزشکی به طور چشم گیری متحول شده است. با توجه به کثرت وجود این داده ها، بدیهی است که تحلیل و مدل بندی آن ها می تواند تأثیر عمده ای در راستای تولید دانش آماری داشته باشد. اما در تحلیل این داده ها با دو مشکل عمده روبرو هستیم. داده های همبسته و داده های گم شده. این دو مشکل فرض آماری مشاهده های مستقل در روش های رگرسیونی سنتی را نقض می کند. با وجود این که اکثر مطالعه ها برای گرداوری تمام داده ها طراحی می شوند ولی بروز گم شدگی در داده ها نیز اجتناب ناپذیر خواهد بود. مکانیسم های گم شدگی یک مسئله ی حائز اهمیت است زیرا خصوصیات روش های برخورد با گم شدن داده ها به این مکانیسم ها مربوط می شود. با در نظر گرفتن یک متغیر نشانگر برای وضعیت گم شدگی و توزیعی برای آن، سه مکانیسم گم شدگی تصادفی،کاملاً تصادفی وغیرتصادفی برای داده ها تعریف می شوند. در چنین شرایطی روش معادله های براوردساز تعمیم یافته معرفی می شود. این رویکرد یکی از مناسب ترین روش ها را برای تحلیل فراهم می کند . در این معادله ها تنها فرض هایی که اختیار می شوند ، فرض درباره ی امید ریاضی حاشیه ای مرتبه ی اول و دوم پاسخ ها است و هیچ فرضی درباره ی توزیع کامل آنها اختیار نمی شود . حال مسئله ی مورد نظر ما تعریف می شود. با چه روش هایی بر پایه gee می توان به براورد پارامترها در حضور داده های گم شده پرداخت؟ از مهمترین روش ها در رویارویی با داده های گم شده روش جانهی است که این روش و انواع مختلف آن از جمله جانهی ساده، جانهی میانگینی و جانهی چندگانه را بیان می کنیم. روش دوم روش موسوم به وزن دهی است که در آن، سهم هر مشاهده در معادله براوردساز برابر با معکوس احتمال مشاهده شده ی آن است. روش بعدی استفاده از تقریب توزیع چندمتغیره ی نرمال است که از براورد نرمال برای پارامترهای همبستگی بهره می برد. روش دیگر آلگوریتم au است که یک روش تکراری را برای حل معادله های براوردساز تعمیم یافته در حضور داده های گم شده ارائه می کند. در پایان تلاش خواهیم کرد با یک مطالعه شبیه سازی روش های گوناگون را مقایسه کنیم. در مجموع بر حسب اریبی و خطای استاندارد نتایج شبیه سازی نشان می دهند که روش آلگوریتم au از سایر روش ها در مواجهه با داده های گم شده بهتر عمل می کند.

برای دانلود 15 صفحه اول ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تعیین براورد پارامترهای حاصل از معادلات براوردساز نیم پارامتری تعمیم یافته در حضور تابع تاوان

انتخاب متغیر یکی از مسئله های مهم در آمار است. انتخاب متغیر برای ساختار نیم پارامتری دشوار است. به این دلیل که مسئله انتخاب متغیر برای هر دو جزء پارامتری و ناپارامتری مورد توجه است لذا به شیوه های جاری نمی توانیم برای ساختار نیم پارامتری انتخاب متغیر کنیم. مدل های نیم پارامتری خواص مدل های پارامتری و ناپارامتری را از دست نمی دهد. مدل های نیم پارامتری معرفی شده در مقاله های متعدد خاصیت انعطاف پذ...

تاثیر داده های گمشده در نمودارهای رشد

سابقه و هدف: استفاده از منحنی رشد قدرتمندترین وسیله پایش رشد کودکان می باشد و از این طریق می توان انحرافات از الگوی رشد طبیعی را بموقع تشخیص داد. ریزش داده ها و مقادیر گمشده از مشکلات معمولی در تجزیه و تحلیل داده های طولی رشد محسوب می شود. لذا اهمیت دارد که با برآورد نمودن مقادیر گمشده، داده ها کامل شده و در مسیری مناسب و صحیح جهت تحلیل قرار داده شوند. مواد و روش ها: این مطالعه طولی طی دو سال ب...

متن کامل

مدل سازی جواب های سالیتونی معادله غیر خطی تعمیم یافته رادهاکریشنان-کاندو-لاکشمینن

بیشتر مسائل در فیزیک، ریاضی و مهندسی از جمله مکانیک سیالات (جریان سیال و انتقال حرارت و...) فیزیک پلاسما، لیزر، اپتیک و معادلات به طور ذاتی غیر خطی هستند. اکثریت این مسائل توسط معادلات دیفرانسیل جزئی و معمولی شکل پیدا می کنند. به جزء تعداد محدودی از این معادلات که داری حل تحلیلی دقیق هستند، بیشتر این مسائل حل دقیق ندارند؛ که باید به وسیله شیوه‌های جدیدی مبتنی بر کد نویسی هایی بر پایه نرم افزاره...

متن کامل

تعدیل اثر خروج تصادفی در آمارگیری های طولی به روش معادله های براورد تعمیم یافته

در اکثر آمارگیری ها، برخی از واحدها به علت عدم برقراری تماس یا امتناع از پاسخ دادن، هیچ اطلاعاتی ارایه نمی کنند. بی پاسخی واحد تقریباً در تمام آمارگیری ها شایع است. این مشکل آماره های آمارگیری را اریب می کند. یک روش برای جبران اثر بی پاسخی واحد، وزن دهی است. داده های همبسته در علوم تربیتی و بخصوص در علوم اجتماعی بسیار رایج هستند. یکی از پرکاربردترین نوع داده های همبسته، داده های طولی هستند. ...

15 صفحه اول

تحلیل استوار داده های فضایی در حضور داده های دورافتاده

معمولاً تابع تغییرنگار که ساختار همبستگی داده­های فضایی را تعیین می­کند و نقش پایه­ ای در تحلیل آن­ها دارد، نامعلوم است و لازم است براساس مشاهدات برآورد شود. وجود داده­ های دورافتاده در مشاهدات تاثیر نامناسبی در برآورد تغییرنگار و سایر بخش­های تحلیل داده­های فضایی همچون پیش­گویی فضایی و برآورد پارامترهای روند دارد. در این مقاله ابتدا با استفاده از برآوردگرهای مقیاس، چند برآوردگر استوار جدید با ن...

متن کامل

معادلات برآورد تعمیم یافته و کاربرد آن در تحلیل داده های کولیک شیرخوارگی

Introdiuction and objective: Many Studies about Epidemiology and medical sciences that measured desired outcome at frequently individuals over times are done based on a longitudinal design. the features of a data set is repeated observes . For this reason , requirement of independence observation in longitudinal data is violated that causes this kind of data needs the specific statistical metho...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

download first 15 pages

برای دانلود 15 صفحه اول ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2022