مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی

نویسندگان

  • افشاری‌صفوی, علیرضا گروه آمار و اپیدمیولوژی، دانشکده بهداشت، دانشگاه علوم پزشکی اصفهان
  • رضایی, منصور گروه آمار و اپیدمیولوژی، دانشکده بهداشت، مرکز تحقیقات توسعه اجتماعی و ارتقاء سلامت دانشگاه علوم پزشکی کرمانشاه
چکیده مقاله:

Background and Objectives: Missing data is a big challenge in the research. According to the type of the study and of the variables, different ways have been proposed to work with these data. This study compared five popular imputation approaches in addressing missing data in the questionnaires. Methods: In this study, 500 questionnaires were used for self-medication in diabetic patients. Missing in the observations was artificially generated by random selection of questions and then deleting them. Five imputation ways included: 1) the mean of the questions, 2) the mean of the person, 3) the mode of the person, 4) linear regression, and 5) EM algorithm. For each method, the mean and standard deviation were compared with imputation. The Spearman correlation coefficient, the percentage of incorrectly classified and kappa statistic were also calculated. Results: A kappa higher than 0.81 represented almost perfect agreement at 10% missingness. The EM algorithm showed the highest level of agreement with the results of actual data with a Kappa of 0.886. With increasing missingness to 30%, the EM algorithm and the mean of  the person showed a rather similar agreement with a Kappa of 0.697 and 0.687, respectively. Conclusion: In this study, the EM algorithm was the most accurate method for handling missing data in all models. The mean of the person method is easy for handling missing data, especially for most non statisticians.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه روش الگوریتم em و روش های متداول جانهی داده های گمشده: مطالعه روی پرسشنامه خوددرمانی بیماران دیابتی

مقدمه و اهداف: داده های گمشده، چالش بزرگی در پژوهش ها به شمار می آیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روش های گوناگونی برای کار با این داده ها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در داده های پرسشنامه ای بود. روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهده ها ...

متن کامل

مقایسه‌ی جانهی الگوریتم EM با دو روش جانهی میانگینی و نمونه‌های جدید در آمارگیری‌های پانلی

 در اقتصاد و سایر علوم اجتماعی، پژوهش‌گران اغلب تمایل به مدل‌بندی داده‌های پانلی که در آن واحدهای نمونه‌ای به‌‌طور مکرر در مقاطع زمانی مختلف مشاهده می‌شوند، دارند. یکی از کاربردهای داده‌های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری‌ها به ویژه آمارگیری‌های پانلی، بی‌پاسخی یک مشکل اساسی است که در داده‌های علوم اجتماعی و پزشکی به وفور رخ می‌دهد. این نوع مطالعه‌ها م...

متن کامل

جانهی داده های گمشده در آمارگیری های پانلی با استفاده از الگوریتم em

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در انواع آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها مع...

15 صفحه اول

مقایسه ی جانهی الگوریتم em با دو روش جانهی میانگینی و نمونه های جدید در آمارگیری های پانلی

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها معم...

متن کامل

مقایسه رفلکس H متداول و مرکزی در بیماران دیابتی دارای نوروپاتی محیطی

چکیده: مقدمه و هدف: دیابت شایع‌ترین بیماری غدد درون‌ریز و از شایع‌ترین علل درگیری اعصاب محیطی می‌باشد. بعضاً روش‌های الکترودیاگنوز متداول و هم‌چنین روش‌های تصویربرداری از جمله ام‌آرآی در بیماران دیابتی دارای نوروپاتی محیطی، عدم وجود رادیکولوپاتی هم‌زمان (از جمله درگیری ریشه عصبی ساکرال اول ) را به طور دقیق نمی-تواند مشخص کند. بسیاری از این بیماران ممکن است در نتیجه عدم تشخیص قطعی تحت اعمال ج...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 11  شماره None

صفحات  43- 51

تاریخ انتشار 2015-11

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023