نام پژوهشگر: سید کاوه احمدی ابهری

دسته بندی داده های چند برچسبی با استفاده از سامانه های دسته بندی یادگیرنده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1391
  سید کاوه احمدی ابهری   ستار هاشمی

دسته بندی یکی از مهمترین فرآیندهای مورد مطالعه در حوزه یادگیری ماشین و داده کاوی است که در برنامه های کاربردی فراوانی از جمله دسته بندی متن، تشخیص پزشکی، بیوانفورماتیک و... مورد استفاده قرار می گیرد. مسائل دسته بندی را می توان براساس تعداد برچسب های منتسب به هر یک از داده ها به دو دسته کلی مسائل دسته بندی تک برچسبی و مسائل دسته بندی چند برچسبی تقسیم کرد. در مسائل دسته بندی تک برچسبی، هر داده دارای یک برچسب منحصر به فرد است. اکثر مطالعات صورت گرفته در حوزه یادگیری ماشین مربوط به این نوع مسائل دسته بندی بوده است. اما مسائل مهم زیادی وجود دارد که حل آنها مستلزم انجام دسته بندی چند برچسبی است. در این مسائل، هر داده ممکن است به بیش از یک برچسب منتسب شود. سامانه های دسته بندی یادگیرنده (lcs) یک اسلوب ایجاد و استنتاج قوانین هستند که از الگوریتم ژنتیک به عنوان ساز و کار اولیه جستجو استفاده می کنند. این اسلوب ها به دنبال یک مجموعه از قوانین قابل اطمینان و با درجه صحت بالا هستند. اگرچه فعالیت های مختلفی برای انجام دسته بندی توسط سامانه های دسته بندی یادگیرنده انجام شده است اما اکثر این فعالیت ها نیز برای دسته بندی داده های تک برچسبی بوده و در مورد دسته بندی چند برچسبی این تحقیقات در اول راه قرار دارد. هدف اصلی این تحقیق، ایجاد یک مجموعه قوانین با استفاده از lcs برای دسته بندی داده های چند برچسبی است که نتایجی کارآمد و قابل مقایسه با سایر روش های دسته بندی چند برچسبی داشته باشد. در این تحقیق از xcs به عنوان سامانه پایه استفاده شده و بخش های عمده آن برای ایجاد امکان مواجهه با داده های چند برچسبی مورد تغییر قرار گرفته است. برای این منظور دو روش مختلف بازنمایی دانش برای مسائل دسته بندی چند برچسبی، روش پاداش دهی متناسب با این مسائل و یک ساز و کار کشف قوانین که با استفاده از یک مکانیزم رای گیری برای lcs و با بهره گیری از تجربیات قبلی سامانه ی کشف را هدایت می کند معرفی شده است.