حسین صامتی

طراحی و پیاده سازی سیستم تبدیل متن به گفتار در زبان کردی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی و مهندسی 1388
وفا بارخدا بهرام ظهیر اعظمی

رویه تبدیل متن به گفتار از دو بخش اصلی سطح بالا (تحلیل متن) و سطح پایین (تولید گفتار) تشکیل شده است. در قسمت سطح بالا، متن ورودی به شکلی درمی آید که در مرحله دوم قابل استفاده باشد. تا به حال روش های گوناگونی برای تولید گفتار در قسمت سطح پایین به کار رفته است که در این میان سه روش تولیدی، مبتنی بر فرمنت و اتصالی بیشترین کاربرد را داشته اند. روش مبتنی بر فرمنت بر اساس اختلاف فرمنت ها در اصوات مختلف کار کرده و در طی دهه های گذشته بیشترین استفاده را داشته است. با این وجود در سال های اخیر روش اتصالی که بر اساس اتصال واحدهای از پیش ضبط شده کار می کند، محبوبیت بیشتری یافته اند. به لحاظ نظری، دقیق ترین و کامل ترین روش برای تولید گفتار، روش تولیدی است که بر اساس مدل کردن دستگاه تولید گفتار انسان کار می کند. با این وجود به لحاظ عملی این روش هنوز دارای پیچیدگی های زیادی بوده و بنابراین زیاد مورد استفاده قرار نگرفته است. در طول دهه های اخیر و همزمان با توسعه روش های تبدیل متن به گفتار، این سیستم ها در حوزه های بیشتری کاربرد پیدا کرده اند. گفتار مصنوعی می تواند به منظور خواندن پست های الکترونیکی، کاربرد در ابزارهای چندرسانه ای و به طور خلاصه برای تعامل بین انسان و ماشین به کار رود. علاوه بر این موارد، ارزیابی کیفیت گفتار تولید شده هم یکی دیگر از پارامترهای بسیار مهم است که البته به سادگی قابل دستیابی نیست. به همین منظور بازه گسترده ای از روش های ارزیابی به وجود آمده اند که هر کدام برخی از جنبه های گفتار را مورد بررسی قرار می دهند. امروزه برای بسیاری از زبان های دنیا، سیستم های تبدیل متن به گفتار با کیفیت های مختلف به وجود آمده است. در این پایان نامه، ما سه سیستم مختلف تبدیل متن به گفتار را برای زبان کردی و بر اساس واحدهای واج گونه، هجا و دایفون طراحی و پیاده سازی کرده ایم. در هر سه این سیستم ها از روش اتصالی برای تولید گفتار استفاده شده است. شرح مختصری از هر کدام از این سیستم ها و واحدهایشان به همراه ویژگی های خاص زبان کردی بیان شده است. همچنین نحوه تولید اطلاعات نوایی و راهکارهایی برای افزایش میزان طبیعی بودن گفتار تولید شده ارائه شده است. در نهایت هم چالش های موجود و کارهایی که در آینده می تواند در راستای تکمیل این پایان نامه انجام گیرد مورد بررسی قرار گرفته اند.

۱۵ صفحه ی اول

تحلیل سیستم ترجمه ماشینی آماری فارسی- انگلیسی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی 1389
سمیه بخشایی نوشین ریاحی

این پایان نامه تلاشی است در جهت بررسی رویکرد جدید شاخه ترجمه ماشینی که از روش های آماری برای ساخت یک مترجم خودکار استفاده می کند. در فصل تجربیات ، ابتدا سیستم مترجم ماشینی آماری که برای جفت زبان فارسی-انگلیسی راه اندازی شده بهمراه خروجی این سیستم نشان داده شده است و پارامترهای آن مورد مطالعه قرار گرفته است. در ادامه به عنوان مطالعات جانبی اولین سیستم ترجمه آماری فارسی-آلمانی طراحی شده است. در این بخش ایده زبان پل به عنوان روشی برای ساخت مترجم آماری برای زبان هایی که پیکره موازی مستقیم ندارند تشریح شده و نتایج موفقیت آمیز آن در آزمایشات نیز نشان داده شده است. همچنین سعی شده با اعمال ایده هایی در مرحله پیش پردازش خروجی ترجمه بهبود داده شود. این تغییرات در راستای تسهیل ترجمه بین دو زبان با هدف افزایش کیفیت آن است. در انتها خروجی سیستم مترجم آماری تحلیل شده و خطاهای چنین سیستم هایی برای بهبودهای آتی مورد بررسی قرار گرفته است. خروجی این پایان نامه ابتدا یک پیکره دو زبانه موازی فارسی-انگلیسی است که در طی یک طرح تحقیقاتی مصوب دانشگاه الزهرا ساخته شده است. این پیکره با استفاده از ریشه یاب دانشگاه شهید بهشتی ریشه یابی شده است که برای مطالعات آتی به عنوان پیکره جانبی قابل استفاده است. همچنین یک پیکره طلایی حاصل تلاش های انجام شده در این پایان نامه است. پیکره طلایی پیکره ای است که علاوه بر هم ترازی در سطح جملات، کلمات نیز هم تراز شده اند. این پیکره دستی هم تراز شده، در یک کارگروه یکروزه و با استفاده از قضاوت انسانی ساخته شده است. در انتها نیز نتیجه گیری کلی از تجربیات این تحقیق عنوان شده و مسیر آتی تحقیقات نیز ترسیم شده است.

۱۵ صفحه ی اول

چارچوبی جدید برای بازیابی اطلاعات به منظور استفاده در بازیابی صدای گفتاری فارسی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده مهندسی کامپیوتر 1390
سید سعید صرفجو روح الله دیانت

موضوع این پایان‏نامه بررسی مسأله بازیابی اطلاعات در متن حاصل از بازشناسی گفتار می‏باشد. یک ورودی مسأله، تعدادی سند متنی که از بازشناسی گفتار به دست آمده‏اند می‏باشد. ورودی دوم نیز یک کوئری است. هدف این است که کوئری را در اسناد جستجو نموده و اسناد مرتبط را پیدا کنیم. مشکلی که در اینجا وجود دارد این است که متن حاصل از بازشناسی گفتار، همواره دارای درصد خطایی در بازشناسی است که موجب می‏شود کلمات دچار خطا شده، معادل با کوئری در نظر گرفته نشوند و در نتیجه سند، مرتبط تشخیص داده نشود. در این پایان‏نامه یک روش بازیابی اطلاعات مقاوم نسبت به خطای بازشناسی گفتار ارائه شده است. ایده کلی این است که برای هر کلمه مهم موجود در سند، تعدادی کلمه مشابه در نظر بگیریم. به این ترتیب به ازای هر سند، تعدادی سند جایگزین به دست میآید. با توجه به تعداد زیاد اسناد جایگزین، در مرحله بعد، موثرترین اسناد جایگزین انتخاب می‏گردند. این اسناد جایگزین به اسناد فعلی اضافه گردیده و در نهایت الگوریتم بازیابی روی مجموعه جدید اسناد اعمال می‏گردند. برای هر یک از مراحل یافتن کلمات مهم، یافتن کلمات مشابه و به دست آوردن موثرترین اسناد، الگوریتم‏های کارایی پیشنهاد شده است. نتایج پیاده‏سازی، نشان‏دهنده کارایی مناسب‏تر‏ روش ارائه شده نسبت به روش‏های بازیابی اطلاعات معمولی است. به طور خلاصه می‏توان گفت در این پایان‏نامه، پیش‏پردازشی ارائه شده است که انجام آن قبل از اعمال الگوریتم بازیابی اطلاعات، موجب کارایی مناسب‏تر آن در حوزه بازیابی متون حاصل از بازشناسی گفتار می‏شود.

ترکیب مدل های زبانی برای درک زبان گفتار در یک موتور محاوره فارسی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1388
فاطمه کاوه یزدی سید ابوالفضل شاهزاده فاضلی

سیستم های محاوره به عنوان یکی از ابزارهای کلیدی در تعامل انسان و ماشین در دهه های اخیر مورد توجّه قرار گرفته و شاخه بزرگی از پردازش های زبانی را بوجود آورده اند. سیستم های محاوره به نوبه خود از زیرسیستم هایی تشکیل شده اند که هر یک بابی را در تحقیق های زبانی گشوده اند و از آن جمله می توان به پردازش های زبانی درک گفتار محاوره اشاره کرد. این پایان نامه تلاش ها در جهت ترکیب مدل های زبانی برای درک زبان گفتار فارسی آغاز نموده و در قالب آن به بررسی روش های پردازشی برای کاربرد درک با استفاده از داده های لایه های معنا و پایین تر صورت داده است. نتایج پژوهش های اجرا شده منجر به طراحی دو الگوی ترکیبی از مدل های زبانی شده است. مدل اوّل در این طرح براساس یک بستر کاری ترکیبی از بازشناسی و درک گفتار توسعه یافته و با دریافت لیستی از بهترین فرضیات بازشناسی گفتار، آنها را بهبود بخشیده و به عنوان ورودی واحد درک گفتار به کار گرفته است. این مدل با استفاده از یک الگوی سه جزئی ترکیب شده با مدل n-gram توانسته علاوه بر فراهم سازی انعطاف ناشی از بکارگیری الگوی معنایی سه جزئی از مزایای جهت دهی جستجوی مدل آماری نیز استفاده نماید. مدل دومی که در این پایان نامه به عنوان یک مدل جدید پیشنهاد شده است، یک الگوی سلسله مراتبی اولویت دار است، که از یک ابرساختار مبتنی بر ماشین متناهی الحالت برای کشف قاب ها استفاده نموده و از لایه هایی بعدی آن نیز برای تعیین شکاف های قاب مورد نظر بهره برده است. ارزیابی واحد درک طراحی شده در دو فاز و با جزئیات مندرج در فصل پنجم به انجام رسیده و برتری مدل دوم را بر مدل اوّل اثبات نموده است.

۱۵ صفحه ی اول

نام پژوهشگر: حسین صامتی