نام پژوهشگر: اشرف عاشقی

تشخیص گفتار از موسیقی در داده های صوتی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی 1392
  اشرف عاشقی   نوشین ریاحی

با توجه به رشد و توسعه اینترنت و تکنولوژی اطلاعات در سال های اخیر،بازیابی اطلاعات فایل های صوتی و سازمان دهی آن بر اسـاس نوع صوت برای اهداف گوناگون به چالشی مهم در داده کــاوی تبدیل شده است.داده های صوتی اغلب شامل بخش های متناوبی از انواع مختلف به ویژه گفتار و موسیقیهستند. بنابراین یکی از کارهای بنیادی در دستکاری این قبیل داده هاتفکیک این دسته های گوناگون می باشد و بر این اساس که در یک فایل داده صوتی انواع گفتار و موسیقی حجم عظیمی از داده را به خود اختصاص می دهند ، ضرورت مسئله تفکیک گفتار/موسیقی که اغلب به عنوان اولین گام در فرایند پردازش داده مطرح است، ثابت می شود.از طرفی انواع متفاوتی از موسیقی وجود دارد که تفــاوت هایی را از لحاظ ویژگی های صــوتی ایجاد می کنند. دسته بندی سبک های موسیقی در نقاط مختلف جهان تعاریف متعددی دارد وبر اساس پژوهش های انجام گرفته در زمینه کلاس بندی گفتار/موسیقی، مسئله زبان بر روی نتایج تأثیرگذار است بنابراین کارایی سیستم طراحی شده برای داده های موسیقی غربی، در هنگام استفاده برای داده های فارسی به ویژه با درنظرگیری کلاس های موسیقی سنتی ایرانی، تضمین شده نیست. هدف اصلی این پژوهش کلاس بندی سیگنال صوتی در دسته های گفتار و موسیقی بر روی داده های فارسی و بهبود روش های کلاس بندی گفتار/موسیقی با استفاده از ویژگی های کارآمد می باشد و به منظور پوشش هر نوع داده صوتی، مرز بین کلاس های مورد نظر کاملاً تعریف شده است. در این پایان نامه در جهت رسیدن به اهداف ذکر شده، یکی ازکارهای انجام گرفته استفاده از یک ویژگی آماری و اعمال آن بر روی ویژگی های کارآمد سیگنـال صوت در جهت دستیابی به یک مفهـوم کـارا برای توصیف هرچه بهتـر شکل موج سیگنـال می باشد.در نتیجه ضرایب گشتاور بدست آمده از ویژگی های کپسترال سیگنال صوتی به عنوان یک ویژگی بهینه در این پژوهش معرفی گردید.این ویژگی بالاترین درصد کارایی را در کلاس بندی گفتار/موسیقی/ آواز به دست داده است. علاوه بر این، با استفاده از همین ویژگی ها عملکرد روش های استخراج ویژگی پیشین در کلاس بندی انواع سبک موسیقی نیز بهبودیافته است. در این پژوهش علاوه بر ارائه این ویژگی ها،دستگاه های موسیقی سنتی ایرانی نیز با به کارگیری روش انتخاب ویژگی دو مرحله ای و انتخاب بهترین ویژگی های صوتی، با بالاترین دقت تفکیک شدند. با توجه به حجم عظیم ویژگی های صوتی ورودی به گام انتخاب ویژگی و لزوم توجه به اطلاعات بهینه ارائه شده توسط هر دسته از ویژگی ها، اعمال یک الگوریتم سریع و دقیق مبنای عمل قرار گرفت و با اضافه نمودن یک گام پس پردازش به الگوریتم رتبه بندی relief و دو مرحله ای نمودن فاز انتخاب ویژگی، بهترین ویژگی های صوتی انتخاب گردید. به دلیل این که هدف اصلی این پایان نامه کار کردن بر روی موسیقی ایرانی است، بنابراین به علت عدم وجود مجموعه داده مناسب، برای شروع، ایجاد مجموعه داده مناسب در اولویت تحقیق قرار گرفته است.