تشخیص گفتار از موسیقی در داده های صوتی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی
  • نویسنده اشرف عاشقی
  • استاد راهنما نوشین ریاحی
  • سال انتشار 1392
چکیده

با توجه به رشد و توسعه اینترنت و تکنولوژی اطلاعات در سال های اخیر،بازیابی اطلاعات فایل های صوتی و سازمان دهی آن بر اسـاس نوع صوت برای اهداف گوناگون به چالشی مهم در داده کــاوی تبدیل شده است.داده های صوتی اغلب شامل بخش های متناوبی از انواع مختلف به ویژه گفتار و موسیقیهستند. بنابراین یکی از کارهای بنیادی در دستکاری این قبیل داده هاتفکیک این دسته های گوناگون می باشد و بر این اساس که در یک فایل داده صوتی انواع گفتار و موسیقی حجم عظیمی از داده را به خود اختصاص می دهند ، ضرورت مسئله تفکیک گفتار/موسیقی که اغلب به عنوان اولین گام در فرایند پردازش داده مطرح است، ثابت می شود.از طرفی انواع متفاوتی از موسیقی وجود دارد که تفــاوت هایی را از لحاظ ویژگی های صــوتی ایجاد می کنند. دسته بندی سبک های موسیقی در نقاط مختلف جهان تعاریف متعددی دارد وبر اساس پژوهش های انجام گرفته در زمینه کلاس بندی گفتار/موسیقی، مسئله زبان بر روی نتایج تأثیرگذار است بنابراین کارایی سیستم طراحی شده برای داده های موسیقی غربی، در هنگام استفاده برای داده های فارسی به ویژه با درنظرگیری کلاس های موسیقی سنتی ایرانی، تضمین شده نیست. هدف اصلی این پژوهش کلاس بندی سیگنال صوتی در دسته های گفتار و موسیقی بر روی داده های فارسی و بهبود روش های کلاس بندی گفتار/موسیقی با استفاده از ویژگی های کارآمد می باشد و به منظور پوشش هر نوع داده صوتی، مرز بین کلاس های مورد نظر کاملاً تعریف شده است. در این پایان نامه در جهت رسیدن به اهداف ذکر شده، یکی ازکارهای انجام گرفته استفاده از یک ویژگی آماری و اعمال آن بر روی ویژگی های کارآمد سیگنـال صوت در جهت دستیابی به یک مفهـوم کـارا برای توصیف هرچه بهتـر شکل موج سیگنـال می باشد.در نتیجه ضرایب گشتاور بدست آمده از ویژگی های کپسترال سیگنال صوتی به عنوان یک ویژگی بهینه در این پژوهش معرفی گردید.این ویژگی بالاترین درصد کارایی را در کلاس بندی گفتار/موسیقی/ آواز به دست داده است. علاوه بر این، با استفاده از همین ویژگی ها عملکرد روش های استخراج ویژگی پیشین در کلاس بندی انواع سبک موسیقی نیز بهبودیافته است. در این پژوهش علاوه بر ارائه این ویژگی ها،دستگاه های موسیقی سنتی ایرانی نیز با به کارگیری روش انتخاب ویژگی دو مرحله ای و انتخاب بهترین ویژگی های صوتی، با بالاترین دقت تفکیک شدند. با توجه به حجم عظیم ویژگی های صوتی ورودی به گام انتخاب ویژگی و لزوم توجه به اطلاعات بهینه ارائه شده توسط هر دسته از ویژگی ها، اعمال یک الگوریتم سریع و دقیق مبنای عمل قرار گرفت و با اضافه نمودن یک گام پس پردازش به الگوریتم رتبه بندی relief و دو مرحله ای نمودن فاز انتخاب ویژگی، بهترین ویژگی های صوتی انتخاب گردید. به دلیل این که هدف اصلی این پایان نامه کار کردن بر روی موسیقی ایرانی است، بنابراین به علت عدم وجود مجموعه داده مناسب، برای شروع، ایجاد مجموعه داده مناسب در اولویت تحقیق قرار گرفته است.

منابع مشابه

شیوه های بکارگیری مجموعه های صوتی در موسیقی آتنال

ایجاد روش های نوین برای هدایت اصوات موسیقایی که با سیستم های قدیمی به جا مانده از دوره های کلاسیک و رمانتیک متفاوت باشد، همواره دغدغة اصلی آهنگ سازان قرن بیستم بوده است. تلاش برای رسیدن به صدادهندگی جدید برای بیان مواردی که زاییدة این قرن بوده اند باعث شده است که سیستم های تازه ایی از طرف آهنگ سازان ایجاد شود و در خلق آثار بکار برده شوند. بعضی از این روش ها با استقبال گسترد هتری از طرف آهنگ...

متن کامل

تشخیص احساسات از سیگنال های گفتار براساس روش های فیلتر

گفتار ابزار اولیه ارتباط بین انسان‌‌ می‌باشد. با افزایش تراکنش میان انسان و ماشین نیاز به محاوره خودکار این دو و حذف کاربر انسانی مورد توجه قرار گرفته است.هدف از انجام این تحقیق، تعیین یک مجموعه از ویژگی‌های تاثیر گذار در تشخیص احساسات مبتنی بر سیگنال صحبت می‌باشد. در این مقاله، سیستمی طراحی گردید که شامل سه بخش اصلی، استخراج ویژگی، انتخاب ویژگی و طبقه‌بندی می‌باشد. پس از استخراج ویژگی‌های پرکا...

متن کامل

تشخیص احساسات از سیگنال های گفتار براساس روش های فیلتر

گفتار ابزار اولیه ارتباط بین انسان‌‌ می‌باشد. با افزایش تراکنش میان انسان و ماشین نیاز به محاوره خودکار این دو و حذف کاربر انسانی مورد توجه قرار گرفته است.هدف از انجام این تحقیق، تعیین یک مجموعه از ویژگی‌های تاثیر گذار در تشخیص احساسات مبتنی بر سیگنال صحبت می‌باشد. در این مقاله، سیستمی طراحی گردید که شامل سه بخش اصلی، استخراج ویژگی، انتخاب ویژگی و طبقه‌بندی می‌باشد. پس از استخراج ویژگی‌های پرکا...

متن کامل

تشخیص خودکار سیگنالهای موسیقی و گفتار فارسی

با توجه به رشد روز افزون محتوای چند رسانه¬ای، زمینه¬های تحقیقاتی جدیدی همچون تحلیل محتوای صوتی جهت پردازش، تشخیص و دسته¬بندی داده¬ها بر اساس محتوا معرفی شده است. مسئله دسته¬بندی سیگنال هایِ گفتار و موسیقی که زیر مجموعه¬ای از این تحقیقاتِ جدید است، توسط محققان زیادی مورد توجه و بررسی قرار گرفته است. با این وجود، تاکنون الگوریتمی که بتواند در لحظه همانند سیستمِ شنوایی انسان عمل کرده و سیگنال¬های صوت...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023