دسته بندی داده های چند برچسبی با استفاده از سامانه های دسته بندی یادگیرنده

پایان نامه
چکیده

دسته بندی یکی از مهمترین فرآیندهای مورد مطالعه در حوزه یادگیری ماشین و داده کاوی است که در برنامه های کاربردی فراوانی از جمله دسته بندی متن، تشخیص پزشکی، بیوانفورماتیک و... مورد استفاده قرار می گیرد. مسائل دسته بندی را می توان براساس تعداد برچسب های منتسب به هر یک از داده ها به دو دسته کلی مسائل دسته بندی تک برچسبی و مسائل دسته بندی چند برچسبی تقسیم کرد. در مسائل دسته بندی تک برچسبی، هر داده دارای یک برچسب منحصر به فرد است. اکثر مطالعات صورت گرفته در حوزه یادگیری ماشین مربوط به این نوع مسائل دسته بندی بوده است. اما مسائل مهم زیادی وجود دارد که حل آنها مستلزم انجام دسته بندی چند برچسبی است. در این مسائل، هر داده ممکن است به بیش از یک برچسب منتسب شود. سامانه های دسته بندی یادگیرنده (lcs) یک اسلوب ایجاد و استنتاج قوانین هستند که از الگوریتم ژنتیک به عنوان ساز و کار اولیه جستجو استفاده می کنند. این اسلوب ها به دنبال یک مجموعه از قوانین قابل اطمینان و با درجه صحت بالا هستند. اگرچه فعالیت های مختلفی برای انجام دسته بندی توسط سامانه های دسته بندی یادگیرنده انجام شده است اما اکثر این فعالیت ها نیز برای دسته بندی داده های تک برچسبی بوده و در مورد دسته بندی چند برچسبی این تحقیقات در اول راه قرار دارد. هدف اصلی این تحقیق، ایجاد یک مجموعه قوانین با استفاده از lcs برای دسته بندی داده های چند برچسبی است که نتایجی کارآمد و قابل مقایسه با سایر روش های دسته بندی چند برچسبی داشته باشد. در این تحقیق از xcs به عنوان سامانه پایه استفاده شده و بخش های عمده آن برای ایجاد امکان مواجهه با داده های چند برچسبی مورد تغییر قرار گرفته است. برای این منظور دو روش مختلف بازنمایی دانش برای مسائل دسته بندی چند برچسبی، روش پاداش دهی متناسب با این مسائل و یک ساز و کار کشف قوانین که با استفاده از یک مکانیزم رای گیری برای lcs و با بهره گیری از تجربیات قبلی سامانه ی کشف را هدایت می کند معرفی شده است.

منابع مشابه

ارزیابی رفتار دینامیکی خاک ‏های ریزدانه با استفاده از الگوریتم دسته ‏بندی گروهی داده‏ ها

با توجه به اینکه عملکرد صحیح تأسیسات زیربنایی نیاز به طراحی دقیق دارد، بنابراین ارزیابی دقیق پارامترهای کلیدی با به ‏کارگیری روش­ های نوین از اهمیت ویژه­ ای برخوردار است. در سازه ­های خاکی و سیستم ­های حمل و نقل، به ­عنوان بخشی از مهم ترین ابنیه ­ی فنی و زیرساخت­ ها که خدماتی ضروری برای بشر فراهم می ­نمایند، همواره برآورد و پیش­بینی دقیق ­تر رفتار خاک، بخصوص در برابر بارهای دینامیکی، بسیار اهمی...

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

دسته بندی پرسش ها با استفاده از ترکیب دسته بندها

هدف از تولید و گسترش سیستم های پرسش و پاسخ، ایجاد پاسخ دقیق برای پرسش داده شده به زبان طبیعی می باشد. یکی ازمهم ترین بخش های سیستم های پرسش و پاسخ دسته بندی پرسش است. عمل دسته بندی پرسش، پیش بینی نوع پاسخ مورد نیاز برای پرسش داده شده به زبان طبیعی می باشد. کارهای انجام شده در این زمینه را می توان در دو دسته ی مبتنی بر قانون و مبتنی بر یادگیری تقسیم کرد. در این مقاله برای دسته بندی پرسش ها، از ی...

متن کامل

پیشگویی پیوند در شبکه های اجتماعی با استفاده از ترکیب دسته بندی کننده ها

Abstract Link prediction in social networks is one of the most important activities in analysis of such networks. The importance of link prediction in social networks is due to its dynamic nature. While members and their relationships (links) in such networks are continuously increasing, links may be missed due to various reasons. By predicting such links, the possibility of extension, compl...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023