ارائه یک روش جدید برای تخمین مقادیر گمشده در مجموعه داده

نویسندگان

چکیده مقاله:

اغلب مجموعه داده های مربوط به داده کاوی و ماشین یادگیری دارای داده هایی با مقادیر Missing Values یا داده گمشده می باشند. چگونگی برخورد با داده گمشده و نیز ارائه راهکارهایی مبتنی بر تخمین مقدار مربوط به داده گمشده، منجر به بروز یک مسئله بسیار مهم در زمینه داده کاوی و ماشین یادگیری  شده است. در بین الگوریتم های داده کاوی، الگوریتم C4.5، به دلیل کارآیی، استفاده در کاربردهای مختلف داده کاوی و نیز توانایی در کار کردن و تخمین مقدار داده گمشده در مجموعه داده ها، به طور مکرر مورد استفاده قرار گرفته است. پژوهشگران و محققان روش ها و الگوهای متعددی جهت برخورد با مقادیر داده گمشده و تخمین مقدار آن در مجموعه داده های الگوریتم C4.5 ارائه داده اند که هر یک از روش ها به نحوی موجب افزایش دقت درخت تصمیم و در نتیجه تولید یک درخت تصمیم موثر و کاراتر شده است. لذا در مقاله حاضر ابتدا به بررسی و مرور روش ها و راهکارهای ارائه شده پیشین و سپس به ارائه روش پیشنهادی با عنوان روش جابجایی خصوصیت ها جهت تخمین مقادیر گمشده در مجموعه داده پرداخته خواهد شد و سپس در پایان به مقایسه و ارزیابی دقت حاصل شده روش پیشنهادی با روش های حذف و میانگین خواهیم پرداخت.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه یک روش پیشنهادی برای تخمین مهاجرت داخلی بر پایه داده های رسمی

پیش زمینه: هدف از این مطالعه بررسی میزان دقت روشهای تخمینی مهاجرت داخلی بر اساس داده های رسمی موجود در بانک های اطلاعاتی است که دولت توانایی دسترسی و مدیریت بر آنها را دارد و پیشنهاد کارهایی به منظور تحمین های دقیق مهاجرت داخلی یک پارچه با قابلیت جزء نگری تا سطح شهرستان. مواد و روش ها: این یک مطالعه نمونه ای روی مهاجرانی که در محدوه سالهای 1385 تا 1390 به یکی از نقاط استان یزد مهاجرت داشته اند...

متن کامل

ارائه یک روش جدید برای آنالیز مقاومت پاسخ بازیهای با مقادیر سود تقریبی

معمولاً هنگام استفاده از تئوری بازی ها برای حل مسائل تصمیم گیری دنیای واقعی، مقادیر سود بازیها با تقریب و عدم قطعیت همراه هستند. اما بررسی مراجع نشان می دهد که تا کنون کار چندانی در زمینه آنالیز مقاومت پاسخ بازیهای با سود تقریبی و مشاهده رفتار این پاسخها در حضور عدم قطعیت انجام نشده است. در این مقاله دو معیار ساده برای ارزیابی مقاومت نقاط نش ارائه خواهیم داد. با استفاده از این معیارها، می توان ر...

متن کامل

ارائه یک روش جدید برای آنالیز مقاومت پاسخ بازیهای با مقادیر سود تقریبی

معمولاً هنگام استفاده از تئوری بازی ها برای حل مسائل تصمیم گیری دنیای واقعی، مقادیر سود بازیها با تقریب و عدم قطعیت همراه هستند. اما بررسی مراجع نشان می دهد که تا کنون کار چندانی در زمینه آنالیز مقاومت پاسخ بازیهای با سود تقریبی و مشاهده رفتار این پاسخها در حضور عدم قطعیت انجام نشده است. در این مقاله دو معیار ساده برای ارزیابی مقاومت نقاط نش ارائه خواهیم داد. با استفاده از این معیارها، می توان ر...

متن کامل

ارائه یک روش جدید برای تخمین خواص مخزن با استفاده از آماره‌های فرکتال در یکی از مخازن نفتی‌ایران

توصیف صحیح ناهمگنی‌های خواص مخزن(تخلخل، درجة اشباع آب ونفوذپذیری) نقش مهمی‌در پیش‌بینی درست تولید هیدروکربن در مخازن زیرزمینی دارد. متاسفانه نمی‌توان تنها با چند چاه اکتشافی توزیعات و ناهمگنی‌های خواص مخزن را در مقیاس بزرگ حجم مخزن شناخت. در چنین مواردی یکی از روش‌های بسیار مؤثر و جدید در توصیف و شناسایی توزیعات خواص مخازن در صورت نا کار آمدی روش‌های زمین آماری، استفاده از روش‌های فرکتالی است. ...

متن کامل

ارائه یک مدل جدید جهت تخمین تلاش لازم برای توسعه سرویس های نرم افزاری

تخمین دقیق تلاش لازم برای توسعه سرویس‌های نرم افزاری یک چالش بزرگ هم در صنعت و هم برای محققین است. مفهوم تلاش یک پارامتر مهم و تأثیرگذار در فرآیند توسعه و مدیریت سرویس‌های نرم افزاری است. تخمین دقیق تلاش به مدیران پروژه کمک می‌کند تا منابع را بهتر تخصیص دهند و هزینه و زمان را طوری مدیریت کنند که پروژه در وقت و بودجه تعیین شده به اتمام برسد. یکی از مشهورترین روش‌های تخمین تلاش، استفاده از قیاس و...

متن کامل

ارائه یک روش جدید دو مرحله ای جهت تخمین هوشمند سن افراد

Intelligent age estimation via face images has become an important research topic in machine vision and pattern recognition fields because it has a key role in many applications such as customer behavior analysis in a business intelligence system. Age estimation is a process which analyses an individual face image and estimates his/her age based on the year measure. The age estimation process ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 16  شماره 55

صفحات  13- 13

تاریخ انتشار 2018-12-22

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023