نام پژوهشگر: وریا عبدالله نژاد

خوشه بندی داده های طولی بر اساس مدل های آمیخته گاوسی و ناگاوسی دم کلفت
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده علوم ریاضی 1390
  وریا عبدالله نژاد   عادل محمدپور

چکیده امروزه جمع آوری اطلاعات از طریق کامپیوتر و اینترنت باعث تولید زیاد داده شده است. کسب دانش از مجموعه داده های بزرگ ممکن است پیچیده و در مواردی غیر ممکن به نظر آید، بنابراین نیاز به داشتن روش ها و تکنیک هایی برای تلخیص و استخراج اطلاعات از این نوع داده ها ضروری است. یکی از تکنیک های مرسوم برای این کار خوشه بندی است. اساس این روش خلاصه کردن یک مجموعه از مشاهدات در تعداد محدودی گروه است، یا به طور هم ارز ایجاد یک افراز روی مجموعه ای از مشاهدات در داخل چند گروه جدا از هم به طوری که مشاهدات داخل هر گروه مشابه یکدیگر می باشند و مشاهداتی که در گروه های متفاوت قرار گرفته اند شباهت کمتری دارند. نوع خاصی از داده هایی که در چند سال اخیر بیشتر به آن توجه شده است داده های طولی می باشند که در واحدهای متوالی زمان از واحدهای مشخص به دست می آیند. هدف این پایان-نامه ارائه روشی برای خوشه بندی مدل-پایه برای داده های طولی است. برای این منظور داده های طولی با استفاده از توزیع های گاوسی و ناگاوسی با در نظر گرفتن ساختار کوواریانس مناسب برای این داده ها، خوشه-بندی می شوند.