بازشناسی کلمات دست نویس فارسی بر اساس جداسازی بخش ها

پایان نامه
چکیده

در این تحقیق یک سیستم بازشناسی کلمات فارسی معرفی می شود که از خودهمبستگی محلی مرتبه بالای تصویر قطبی-لگاریتمی برای استخراج ویژگی از زیر- کلمات فارسی استفاده می کند. این شیوه ی استخراج ویژگی باعث می شود سیستم در مقابل تغییرات نگارشی مانند تغییر مقیاس های خطی و چرخش مقاوم شود. از مراحل مهم در یک سیتم بازشناسی کلمات، مرحله استخراج ویژگی می باشد. با توجه به این که کلمات دست نوشته دارای تغییرات نگارشی مختلفی هستند بنابراین بایداز یک طرف، ویژگی ای از تصویر کلمات استخراج شود که در مقابل این تغییرات نگارشی مقاوم بوده واز طرف دیگر، بتواند نماینده منحصربفرد آن در یک کلاس خاص باشد. برخلاف بیشتر سیستم های بازشناسی برپایه hmm که از پنجره لغزان در مرحله استخراج ویژگی، به صورت یکنواخت نمونه گیری می کنند، دراین تحقیق روشی ارائه می شود که استخراج ویژگی به صورت غیر یکنواخت ومتمرکز صورت می گیرد. در واقع به کمک تبدیل قطبی-لگاریتمی ( log-polar ) که در ادامه مورد بحث قرار می گیرد می توان از تصویر کلمه به گونه ایی نمونه برداری انجام داد که بیشترین نمونه ها در یک ناحیه خاص متمرکز باشد و هر چه از آن ناحیه به سمت حاشیه وپیرامون تصویر کلمه پیش می رویم نقاط نمونه برداری شده کمتر شود. مزیت این روش این است که می توان تعداد نقاط نمونه برداری از بخشی ازتصویر کلمه که دارای اطلاعات (پیکسل های سیاه) بیشتری است را افزایش داد. همچنین از آنجاکه چرخش وتغییر مقیاس در تصویرکلمه به صورت شیفت در تصویر log-polar ظاهر می شود، می توان به کمک تابع خود همبستگی که یک تابع غیر حساس به شیفت است، سیستم بازشناسی رادر مقابله با تغییراتی همچون تغییر مقیاس های خطی وچرخش مقاوم کرد. در این سیتم بازشناسی کلمات فارسی از مدل مخفی مارکوف به عنوان طبقه بند استفاده شده است. به این صورت که برای هر زیر-کلمه یک مدل تعریف می شود. مدل های زیر- کلمات با یک شبکه دیکشنریی خاص به یکدیگر متصل می شوند. استفاده از شبکه دیکشنری امنیت و دقت خروجی سیستم بازشناسی را افزایش می دهد. انتهای هر مسیر در شبکه دیکشنری به یک کلمه منحصر بفرد ختم می شود. مجموع این مسیر ها در شبکه، دیتابیس مارا تشکیل می دهند. برای ارزیابی سیستم از دیتابیس "ایران شهر" استفاده شده است. . این دیتابیس شامل نام 30 شهر ازشهرهای ایران می باشدکه توسط 26نویسنده مختلف نوشته شده است. این دیتابیس در مجموع شامل 780نمونه کلمه دست نویس می باشدکه از 600 نمونه آن برای آموزش و 180 نمونه ی آن برای تست استفاده شده است. مقایسه نتایج حاصل از روش پیشنهادی با نتایج سایر روش های استخراج ویژگی، موید این است که سیستم بازشناسی پیشنهاد شده در این مقاله از حساسیت کمتری نسبت به تغییرات نگارشی برخوردار است. به عبارت دیگر می توان گفت، سیستم بازشناسی به روش پیشنهادی، وابستگی کمتری نسبت به یک نویسنده خاص دارد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مدل‌سازی بازشناسی واجی کلمات فارسی

Abstract of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underly...

متن کامل

جداسازی خطوط در متون دست نویس فارسی

هدف این رساله، تقسیم بندی یک سند دستنویس به خطوط مجزا از یکدیگر است. جداسازی و استخراج خط، اولین و مهمترین مرحله پیش پردازش برای آنالیز و بازیابی تصویر یک سند است. هنگامی که یک خط جداسازی شد، (خط ایزوله شده) برای مراحل جداسازی کلمه، شناسایی آن، بازیابی زیرکلمات و حروف و سایر مراحلی که برای آنالیز یک سند مورد نیاز است، تحت بررسی قرار میگیرد. بنابراین استخراج صحیح خطوط، بمنظور درست انجام شدن سایر...

15 صفحه اول

بازشناسی دست نویس شاهنامه کوچک دوم

دست نویس مصوّر شاهنامه، موسوم به شاهنامۀکوچک دوم، نسخه ای، پراکنده و ناقص از شاهنامۀ فردوسی است که بر اساس برگ های مصوّر موجود ازآن و نیز 3 دست نویس مشابه دیگر به سدۀ 8 هجری قمری و کتابت در بغداد منسوب شده است؛ و بر همین اساس به عنوان اولین دست نویس مصوّر شاهنامه تا به امروز محسوب می شود. از این دست نویس 285 برگ در قالب میکروفیلم موجود بوده که متشکل از51 برگ مصوّر و 234 برگ غیر مصوّر است. مطابق بازس...

متن کامل

بازشناسی دست نویس شاهنامة کوچک دوم

دست نویس مصوّر شاهنامه، موسوم به شاهنامۀکوچک دوم، نسخه ای، پراکنده و ناقص از شاهنامۀ فردوسی است که بر اساس برگ های مصوّر موجود ازآن و نیز 3 دست نویس مشابه دیگر به سدۀ 8 هجری قمری و کتابت در بغداد منسوب شده است؛ و بر همین اساس به عنوان اولین دست نویس مصوّر شاهنامه تا به امروز محسوب می شود. از این دست نویس 285 برگ در قالب میکروفیلم موجود بوده که متشکل از51 برگ مصوّر و 234 برگ غیر مصوّر است. مطابق بازس...

متن کامل

بازشناسی برخط نت موسیقی دست نویس

برای بازشناسی نت نوشته موسیقی، دو رویکرد بازشناسی برخط و برون خط وجود دارد. در این پایان نامه، روش هایی برای بازشناسی برخط نت نوشته موسیقی ارائه شده است. ابتدا نرم افزاری برای جمع آوری برخط نت نوشته ها در محیط labview طراحی شد. سپس 24 نت نوشته اصلی موسیقی انتخاب و 55 نمونه دست خط از 30 نفر جمع آوری شد. با استفاده از سه دسته ویژگی جدید و تعدادی ویژگی شناخته شده در زمینه بازشناسی برخط دست نوشته، ...

15 صفحه اول

تشخیص اعداد دست نویس فارسی

در این پایان نامه ما به ارائه یک روش مبتنی بر نمایش تنک برای تشخیص ارقام دست نویس فارسی می پردازیم. در سال های اخیر روش های مبتنی بر نمایش تنک توانسته اند به کارایی قابل توجهی در مسائل بینایی ماشین و پردازش تصویر دست یابند. چالش اصلی در طراحی یک طبقه بند مناسب برای تشخیص ارقام فارسی، مدل کردن زیرفضای داده ها و انجام عمل طبقه بندی بر اساس مدل ارائه شده است. رویکردی که در این پایان نامه برای تشخی...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023