نام پژوهشگر: خشایار یغمایی

تشخیص گفتار فارسی با استفاده از پردازش تصویر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان 1389
  حامد طالع کلیدبری   خشایار یغمایی

در این پایان نامه تعدادی روش برای استخراج ناحیه دهان مورد بررسی قرار گرفته و همچنین یک روش جدید برای استخراج ناحیه دهان معرفی می گردد. در ادامه با استفاده از روش جدید مذکور و روش حذف رنگ قرمز، یک روش تلفیقی جدید و دقیق برای استخراج ناحیه دهان پیشنهاد می شود. با استفاده از این روش ناحیه دهان استخراج شده و سپس ویژگی های ناحیه دهان استخراج می گردد. در ادامه با استفاده از یک روش جدید پیشنهادی کلمات و عبارات چند سیلابی با دقت 90% به تک سیلاب ها تجزیه می شوند. سپس از پارامترهای استخراجی ناحیه دهان از تک سیلاب های بدست آمده، به عنوان ورودی برای شبکه عصبی به منظور تشخیص مصوت استفاده می شود. نرخ تشخیص مصوت در عبارات چند سیلابی برابر 72% می باشد. این آزمایش ها بر روی بانک اطلاعاتی تهیه شده که شامل 8 گوینده که هر گوینده 61 ترکیب وصفی و اضافی، 45 ترکیب دوسیلابی و 10 ترکیب چند سیلابی را دو مرتبه ادا نموده است انجام پذیرفت

پنهان نگاری در تصاویر فشرده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان 1390
  هانیه یکتا   خشایار یغمایی

با توجه به افزایش قابل توجه استفاده از سیگنال های چندرسانه ای در ارتباطات مخابراتی تأمین امنیت برای این سیگنال ها بسیار مهم است. یکی از روش تأمین امنیت، پنهان نگاری اطلاعات است. پنهان نگاری به عنوان علم مخابره ی نامحسوس اطلاعات روی کانال هایی همانند اینترنت، تلفن، ماکرویو و ماهواره ها شناخته می شود. در میان سیگنال های چند رسانه ای، تصاویر دیجیتال، به دلیل استفاده زیاد انها در اینترنت ، دوربین دیجیتال و ... یکی از بهترین ابزار رسانه ای برای پنهان نگاری اطلاعات هستند. از طرفی انتخاب قالب تصویر تأثیر زیادی بر سیستم پنهان نگاری دارد. تصاویر فشرده و در این میان jpeg فرمت عمومی بوده و به طور گسترده مورد استفاده قرار می گیرد ، بطوریکه اگر از فرمت jpeg برای پنهان سازی اطلاعات استفاده شود ، ظن کمتری به تصویر خواهد بود. در این پایان نامه ارائه یک روش جدید برای پنهان نگاری در تصویر jpeg مدنظر می باشد.با توجه به اینکه اکثر روش های پنهان نگاری موجود نرخ جاسازی اطلاعات به نسبت پایین و امنیت نه چندان خوبی را دارا هستند،اهداف مهم و اساسی در این پایان نامه ،افزایش نرخ جایگذاری داده محرمانه و افزایش امنیت تصاویر حاوی اطلاعات رمز می باشند. اساس کار بر مبنای جاسازی اطلاعات در دنباله هایی است که به صورت تصادفی از ضرایب dct کوانتیزه شده در کانال های مختلف تصویر jpeg انتخاب می شوند.بر اساس طول پیام رمز و همچنین تعداد دنباله های انتخابی بهترین تصویر پوشانه انتخاب می شود .ارزیابی کیفیت تصویر حاوی اطلاعات رمز و همچنین مقاومت روش در برابر نهانکاوهای پیاده سازی شده نشان از درجه ی بالای ادراک ناپذیری روش پیشنهادی دارد.

بازشناسی کلمات دست نویس فارسی بر اساس جداسازی بخش ها
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان 1390
  غلامرضا نادعلی نیا چاری   خشایار یغمایی

در این تحقیق یک سیستم بازشناسی کلمات فارسی معرفی می شود که از خودهمبستگی محلی مرتبه بالای تصویر قطبی-لگاریتمی برای استخراج ویژگی از زیر- کلمات فارسی استفاده می کند. این شیوه ی استخراج ویژگی باعث می شود سیستم در مقابل تغییرات نگارشی مانند تغییر مقیاس های خطی و چرخش مقاوم شود. از مراحل مهم در یک سیتم بازشناسی کلمات، مرحله استخراج ویژگی می باشد. با توجه به این که کلمات دست نوشته دارای تغییرات نگارشی مختلفی هستند بنابراین بایداز یک طرف، ویژگی ای از تصویر کلمات استخراج شود که در مقابل این تغییرات نگارشی مقاوم بوده واز طرف دیگر، بتواند نماینده منحصربفرد آن در یک کلاس خاص باشد. برخلاف بیشتر سیستم های بازشناسی برپایه hmm که از پنجره لغزان در مرحله استخراج ویژگی، به صورت یکنواخت نمونه گیری می کنند، دراین تحقیق روشی ارائه می شود که استخراج ویژگی به صورت غیر یکنواخت ومتمرکز صورت می گیرد. در واقع به کمک تبدیل قطبی-لگاریتمی ( log-polar ) که در ادامه مورد بحث قرار می گیرد می توان از تصویر کلمه به گونه ایی نمونه برداری انجام داد که بیشترین نمونه ها در یک ناحیه خاص متمرکز باشد و هر چه از آن ناحیه به سمت حاشیه وپیرامون تصویر کلمه پیش می رویم نقاط نمونه برداری شده کمتر شود. مزیت این روش این است که می توان تعداد نقاط نمونه برداری از بخشی ازتصویر کلمه که دارای اطلاعات (پیکسل های سیاه) بیشتری است را افزایش داد. همچنین از آنجاکه چرخش وتغییر مقیاس در تصویرکلمه به صورت شیفت در تصویر log-polar ظاهر می شود، می توان به کمک تابع خود همبستگی که یک تابع غیر حساس به شیفت است، سیستم بازشناسی رادر مقابله با تغییراتی همچون تغییر مقیاس های خطی وچرخش مقاوم کرد. در این سیتم بازشناسی کلمات فارسی از مدل مخفی مارکوف به عنوان طبقه بند استفاده شده است. به این صورت که برای هر زیر-کلمه یک مدل تعریف می شود. مدل های زیر- کلمات با یک شبکه دیکشنریی خاص به یکدیگر متصل می شوند. استفاده از شبکه دیکشنری امنیت و دقت خروجی سیستم بازشناسی را افزایش می دهد. انتهای هر مسیر در شبکه دیکشنری به یک کلمه منحصر بفرد ختم می شود. مجموع این مسیر ها در شبکه، دیتابیس مارا تشکیل می دهند. برای ارزیابی سیستم از دیتابیس "ایران شهر" استفاده شده است. . این دیتابیس شامل نام 30 شهر ازشهرهای ایران می باشدکه توسط 26نویسنده مختلف نوشته شده است. این دیتابیس در مجموع شامل 780نمونه کلمه دست نویس می باشدکه از 600 نمونه آن برای آموزش و 180 نمونه ی آن برای تست استفاده شده است. مقایسه نتایج حاصل از روش پیشنهادی با نتایج سایر روش های استخراج ویژگی، موید این است که سیستم بازشناسی پیشنهاد شده در این مقاله از حساسیت کمتری نسبت به تغییرات نگارشی برخوردار است. به عبارت دیگر می توان گفت، سیستم بازشناسی به روش پیشنهادی، وابستگی کمتری نسبت به یک نویسنده خاص دارد.

بازشناسی متون فارسی با استفاده از روشهای گرامری و معنایی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده مهندسی برق و کامپیوتر 1390
  پریسا شیروانی   خشایار یغمایی

یکی از رایجترین اشکال انتقال اطلاعات، کاغذ می باشد. حجم زیادی از اطلاعات از طریق کاغذ منتقل می شوند. مستندات کاغذی از تنوع زیادی برخوردار هستند به عنوان مثال اطلاعات روی کاغذ می تواند شامل متون چاپی یا دست نویس، جداول، منحنی ها، تصاویر و ... باشد. ترکیب این اطلاعات بر روی اسناد کاغذی و همچنین استفاده از انواع مختلف قلم ها و ویژگی های خاص باعث دشواریهایی در بازیافت اطلاعات می گردد. علاوه بر این مسائلی از قبیل کیفیت چاپ، کاغذ، جوهر و همچنین کیفیت اسکن یک سند و ... عواملی هستند که کار بازشناسی متن را مشکل تر و پیچیده تر می سازند. ویژگیهای خط فارسی از دیگر موارد مشکل ساز در بازشناسی متون فارسی هستند. تا کنون کارهای زیادی برای متون زبان لاتین، چینی و ژاپنی انجام شده است، اما برای بازشناسایی متون فارسی و عربی با این که بسیاری از جمعیت جهان برای نوشتن از این زبانها استفاده می کنند، کارهای انجام شده نسبتا کم و پراکنده بوده است. از جمله علل این امر پیچیدگی های نوشتاری این زباها، فقدان پایگاه داده و لغت نامه های استاندارد و جامع برای متون فارسی و عربی ذکر شده است. در این پایان نامه الگوریتمی به منظور بازشناسی متون فارسی از ترکیب دو شاخه علمی پردازش تصویر و پردازش زبانهای طبیعی ارائه شده است. الگوریتم پیشنهادی شامل مراحل استخراج شبه کلمات به عنوان یکی از مهمترین اجزای الگوریتم شناسایی متن، ساخت کلمات از ترکیب شبه کلمات استخراج شده و سپس ترکیب کلمات به منظور ساخت جملات بالقوه معنی دار و در نهایت استفاده از دو مدل زبانی بایگرام و ترایگرام و چند قاعده گرامری به منظور تشخیص جمله صحیح بر اساس انطباق با گرامر رایج زبان فارسی می باشد. در الگوریتم ارائه شده، استفاده از قواعد گرامری مانند حذف ترکیبهای دستوری اشتباه منجر به بهبود نتایج حاصل از بازشناسی شد.

نهان نگاری در تصاویر پزشکی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر 1390
  اعظم صباغی ندوشن   خشایار یغمایی

سال های اخیر واترمارکینگ در تصاویر پزشکی به منظور حفاظت از اطلاعات بیمار، گسترش قابل توجه یافته و روش های مختلفی برای این امر طرح شده است. در این پایان نامه، هر سه روش واترمارکینگ که به صورت کور، غیر کور و نیمه کور می باشد صورت گرفته است. روش غیر کور مبتنی بر استفاده از تبدیل موجک و ماسک لبه و بافت برای درج اطلاعات در تصویر پزشکی پیاده-سازی شده است. ماسک لبه و بافت از ضعف مدل سیستم بینایی انسان برای بهبود کیفیت ادراکی تصاویر و کاهش اثر بینایی مارک به کار گرفته می شود. این در حالی است که مقاومت واترمارکینگ را نیز افزایش می دهد. روش نیمه کور و کور با استفاده از تبدیل svd پیاده سازی شده است. تبدیل svd مقادیر ویژه تصویر را مشخص می کند، یکی از مهمترین قابلیت های svd که باعث کاربرد فراوان آن در واترمارکینگ شده است، این است که مقادیر ویژه تصاویر به تنهایی بیانگر ویژگی های روشنایی تصویر می باشند و دارای پایداری بالایی هستند و انجام تغییرات کوچک بر روی آنها تصویر را با تغییر بزرگ مواجه نمی سازد. علاوه بر آن، مقادیر ویژه در تصاویر دیجیتال، کمتر تحت تاثیر عملیات مختلف پردازش تصویر قرار می گیرند. برای ارزیابی روش ارایه شده، از چهار تصویر خاکستری پزشکی mri، ct-scan ، ultrasound، x-ray استفاده شده است. مارک ها که شامل متن تشکیل شده از اطلاعات خصوصی بیمار، سیگنال ecg و اطلاعات بیولوژیک بیمار برای تشخیص هویت است، در نواحی roni که از لحاظ تشخیص پزشکی اهمیت کمتری دارد گنجانده می شوند. روش های ارایه شده مشخصه های مهم واترمارکینگ که شامل مشاهده ناپذیری، مقاومت و ظرفیت مارک قابل درج است را برآورده می سازد.

پنهان نگاری در علائم موسیقی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - پژوهشکده برق و کامپیوتر 1391
  سیدعلی اصغر شهیدیان   خشایار یغمایی

پنهان نگاری در علائم موسیقی عمدتا به منظور حفظ حق نشر انجام می شود. آموزش موسیقی با استفاده از پنهان نگاری در نت، کاربرد جدیدی است که در این پایان نامه ارائه شده است. در این پایان نامه، چهار روش پنهان نگاری در تصویر نت موسیقی ارائه شده است. روش های ارائه شده، بر اساس نمادهای موسیقایی هستند. روش اول، از تغییر ضخامت دنباله ی نت، به منظور پنهان نگاری استفاده می کند. تغییر سطح خاکستری سرنت های سیاه، شیوه ی دیگری از پنهان نگاری است که به عنوان روش دوم ارائه شده است. در نت نگاری موسیقی، روش نگارش واحدی وجود ندارد، بنابراین، در روش سوم، شکل سرنت ها به منظور پنهان نگاری، تغییر داده می شوند. در روش چهارم، از تغییر یکنواخت سطح خاکستری سرنت سیاه، استفاده شده است. در این روش، سطح خاکستری سرنت بر اساس رشته بیت ورودی، از یک سمت، به سمت دیگر به صورت خطی تغییر داده می شود. ظرفیت تمام روش ها به تعداد نت ها بستگی دارد. در روش اول، به ازای هر دنباله ی نت، یک بیت، در روش دوم و سوم، به ازای هر سرنت سیاه، یک بیت و در روش چهارم، به ازای هر سرنت سیاه، دو بیت می توان پنهان نمود.

تشخیص جمله و استخراج جملات با معنی از متن فارسی با استفاده از ویژگی های دستوری
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر 1391
  سیده طاهره میرعمادیان   خشایار یغمایی

امروزه با گسترش کاربرد کامپیوتر، نیاز به استفاده از توانایی های غیر قابل چشم پوشی آن، در حوزه زبان شناسی به شدت احساس می شود.حوزه های پردازش زبان طبیعی و زبان شناسی رایانه ای به تلاش برای ماشینی کردن فرآیند زبان شناسی سنتی می پردازند.هدف اصلی در پردازش زبان طبیعی، ایجاد تئوری های محاسباتی از زبان،با استفاده از الگوریتم ها و ساختارهای داده ای موجود در علوم کامپیوتر است. بدیهی است که در راستای تحقق این هدف، نیاز به دانشی وسیع از زبان است و علاوه بر محققان علوم کامپیوتر ، نیاز به دانش زبان شناسان نیز در این حوزه می باشد. این پایان نامه به کمک ابزارهای زبانی دستور فارسی و اطلاعات آماری و نیز به کارگیری درخت تصمیم گیری سعی در ارائه روشی دارد که به کمک آن بخشی از نیازهای حوزه پردازش زبان طبیعی را پاسخ دهد.از جمله تحقیقاتی که با بکارگیری این ابزار در این پایان نامه انجام شده است، تعیین محدوده جملات فارسی می باشد که در آن، محدوده جملات که شامل ابتدا، انتها، وسط و ابتدا/ انتها می باشد به صورت خودکار شناسایی می شوند. هم چنین از این ابزار در شناسایی انواعی از کلمات مرکب که شامل اسم و صفت مرکب می باشنداستفاده شده است. زیرا وجود کلمات مرکب در جملات و پایین بودن دقت شناسایی این کلمات منجر به تولید جملاتی می شود که گاه به لحاظ دستوری و گاه به لحاظ معنایی نادرست می باشند. بنابراین یکی از راه حل های استخراج جملات بامعنی ، برطرف کردن این معضل می باشد. کلماتمرکب به صورت ترکیبی از دو یا چند کلمه با معنی مجزا در متن ظاهر می شوند و همین امر شناسایی آنها را به عنوان یک کلمه واحد، کمی مشکل می سازد. این روش قابل تعمیم به انواع دیگر کلمات مرکب از جمله حروف ربط و قید نیز می باشد. نتایج بدست آمده در هر دو تحقیق نشان دهنده کارا بودن این روش می باشد.

نهان نگاری گفتار در تصاویر باینری و متن (فارسی و انگلیسی)
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده مهندسی برق و کامپیوتر 1391
  کاظم غلامی   خشایار یغمایی

در این پایان نامه روشی برای نهان نگاری سیگنال گفتار در متون تصویری باینری فارسی ارائه شده است. این روش مبتنی بر کدینگ گفتار lpc10 میباشد. برای پنهان سازی داده ها در تصویر متن ابتدا سیگنال گفتار توسط کدینگ lpc10 به یک رشته بیت باینری تبدیل میشود. برای این کار سیگنال گفتار به قسمتهای کوچکتری به نام فریم تقسیم بندی شده و از هر فریم چهار ویژگی شامل آوایی/غیرآوایی بودن، تناوب گام، ضرایب پیشگویی خطی و بهره استخراج میگردد. سپس این پارامترها توسط عملیات کوانتیزاسیون به یک رشته بیت باینری تبدیل میگردند. برای جاسازی این رشته بیت در تصویر متن از مولفه های پیوسته موجود در متن استفاده شده است. این مولفه ها با کمک توابع پروفایل افقی و عمودی متن استخراج شده و برای نهان نگاری اطلاعات در آنها میزان سطح روشنایی پیکسلهای آنها براساس روش مدولاسیون روشنایی متن یا tlm تغییر میکند. در مرحله بازیابی، پس از استخراج بیتها و به کمک الگوریتم سنتز، سیگنال گفتار بازسازی میشود. این روش بر روی چند نمونه سیگنال گفتار مختلف آزمایش شده است. بررسی نتایج مبین ظرفیت مطلوب و مقاومت مناسب روش ارائه شده در برابر نویز فلفل-نمکی، در عین حفظ امنیت بصری است. روش ارائه شده دارای ظرفیتی معادل 3 بیت در هر مولفه پیوسته است. مقایسه ظرفیت با روشهای مشابه نهان نگاری در متون فارسی وعربی نشان دهنده افزایش ظرفیت این روش میباشد. همچنین مقایسه ظرفیت این روش با روشهای نهان نگاری مبتنی بر tlm نشان دهنده افزایش ظرفیت در این روش است.

سنتز جملات فارسی با استفاده از قواعد گویشی و کسره بین کلمات
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر 1391
  محمدصادق رستمی   سعید مظفری

با پیشرفت چشمگیر علوم رایانه در چند دهه ی اخیر و پررنگ تر شدن نقش آن در زندگی بشر، علوم مختلفی در کنار آن بوجود آمده و رشد کرده اند. یکی از این علوم هوش مصنوعی است و خود نیز به شاخه های متعددی تقسیم می شود که یکی از آن ها پردازش زبان طبیعی است. از شاخه های پردازش زبان طبیعی می توان به تبدیل متن به گفتار اشاره کرد که بیش از پنج دهه بر روی این موضوع کار شده است. در تبدیل متن به گفتار، هدف این است که رایانه قادر باشد تا یک متن را با صدای طبیعی –صدای انسان- بخواند. بدین منظور دو کار باید صورت گیرد: پردازش متن، سنتز گفتار. حدود دو دهه است که زبان فارسی نیز در پردازش رایانه ای مورد توجه قرار گرفته است. برای سنتز گفتار، از سه روش عمده استفاده می شود. روش اول که سعی در مدل سازی دقیق سیستم تولید گفتار انسان دارد، روش دوم که براساس استفاده از فیلترهای سری-موازی برای مدل کردن آواها بنا شده است و روش سوم که از قطعات از پیش ضبط شده استفاده می کند. آزمایشات نشان داده است که روش سوم، گفتار طبیعی تری تولید می کند. هدف از این پایان نامه، تولید گفتار طبیعی در زبان فارسی، با توجه به این سه موضوع است: تکیه ی کلمات، آهنگ جملات و کسره ی اضافه. در روش پیشنهادی، سنتز گفتار بر اساس استفاده از قطعات از پیش ضبط شده به نام دایفون است که دلایل استفاده از آن نیز مطرح شده است. ابتدا با توجه به بحث های زبان شناسی، نقش کلمات در جملات تعیین می گردد و با کمک آن، نوع کلمه مشخص می شود و با دانستن نوع کلمه، جایگاه تکیه در آن استخراج می گردد. سپس نوع جملات مشخص شده و با توجه به آن آهنگ جملات تعیین می شود. همچنین باید جایگاه کسره های اضافه در متن نیز مشخص گردد. با توجه به این مطالب، دایفون ها در هفت حالت استخراج می شوند و در زمان سنتز گفتار، با توجه به تکیه ی کلمات و آهنگ جملات و مکان کسره ی اضافه کنار هم قرار می گیرند. بررسی نتایج نشان می دهد از آن جا که آهنگ جملات و تکیه کلمات و پیوستگی در مکان های کسره ی اضافه، درون قطعات از پیش ضبط شده –دایفون ها- موجود است، استفاده از این روش نوای گفتار طبیعی تری نسبت به برخی سیستم های موجود، تولید می کند. معیار مقایسه نیز mos بوده است که این مقدار در روش پیشنهادی برای طبیعی بودن و اعمال نوای گفتار در چند حالت مختلفی که بررسی شده است، حدود 4.5 به دست آمده است.

«راحی وشبیه سازی آنتن آرایه باند ku برای پوشش ماهواره ای ایران
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - پژوهشکده برق و کامپیوتر 1391
  میثم شعبان سروری   خشایار یغمایی

امروزه، آنتنهای میکرواستریپ به خاطر خواص فیزیکی و الکترومغناطیسی ویژه مانند فشرده سازی، بکارگیری چند باند فرکانسی، طراحی و ساخت راحت، هزینه ساخت کم و... کاربردهای متنوعی دارند. یکی از این کاربردها در ارتباطات ماهواره ای به عنوان فرستنده و گیرنده است، چه در بخش زمینی (مانند گیرنده های gps) و چه در بخش فضایی، بر روی ماهواره ها. در این تحقیق یک آنتن آرایه صفحه ای دو باندی در باند ku (فرکانس 11.3ghz برای دریافت و 14.5ghz برای ارسال) برای پوشش ماهواره ای ایران از یک ماهواره geo با بهره ای در حدود db34 و زاویه پرتو 4/2 و 4 درجه در صفحه e و h، طراحی و شبیه سازی شده است. برای کاهش هزینه و سهولت ساخت، از زیر لایه fr-4 استفاده شده است. روش تزویج روزنه ای برای تغذیه آنتن، از اثرات نا مطلوب شبکه تغذیه بر المانهای تشعشعی می کاهد. شبکه تغذیه به گونه ای طراحی شده است که در هر دو باند مورد نظر، پاسخهای تقریبا مشابهی ارائه گردد. همچنین بکارگیری ساختار ebg در باندهای فرکانسی مورد نظر، بهره را تا حد قابل قبولی بهبود بخشید. شبیه سازی این آنتن با نرم افزار تمام موج cst microwave studio انجام شده و سپس با استفاده از نرم افزار تمام موج ansoft hfss، صحت نتایج حاصل، بررسی و تایید شدند. ابتدا یک آنتن میکرواستریژ دو باندی طراحی شده و در مراحل بعد آرایه شامل این عنصر طراحی و شبیه سازی شده است. آنتن نهایی یک آرایه 48*24 المانه با پارامترهای خواسته شده است.