اکرم السادات حاجیان نژاد

نام پژوهشگر: اکرم السادات حاجیان نژاد

تشخیص فونت فارسی با استفاده از روش های فرکتالی برای بهبود عملکرد سیستم های ocr

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان 1390
اکرم السادات حاجیان نژاد سعید مظفری

در سال های اخیر استفاده از سیستم های تشخیص کاراکتر به خاطر رواج اینترنت و تکنیک های چند رسانه ای شدیداً گسترش یافته است. این سیستم ها محتویات یک متن اسکن شده را خوانده، آن را شناسایی نموده و به صورت یک فایل کامپیوتری ذخیره می کنند. چنین قابلیتی امکان استفاده گسترده ای از کامپیوتر را در پردازش سریع حجم وسیعی از داده های مکتوب تولید شده فراهم می کند. یک سیستم تشخیص کاراکتر از واحدهای مختلفی تشکیل شده است که این واحدها هر روز در حال افزایش و تکاملند. یکی از واحدهایی که اخیراً به این سیستم ها افزوده شده، واحد تشخیص فونت است. اگر چه تشخیص و بازیابی متون مستقل از نوع فونت آن ها غیر ممکن نیست ولی کار مشکلی است، زیرا کاراکترها در فونت های مختلف شکل های مختلفی به خود می گیرند. سیستم های تشخیص کاراکتری که قابلیت تشخیص فونت دارند نسبت به سیستم های معمولی کارایی بهتری داشته و قدرت و دقت بالاتری در تشخیص کاراکتر و بازیابی اسناد دارند. اگر چه واحد تشخیص فونت به سیستم های تشخیص کاراکتر بسیاری از زبان ها افزوده شده است و علیرغم اهمیت وجود چنین واحدی در این سیستم ها، به علت پیچیدگی های ساختاری خط و زبان فارسی، سیستم های تشخیص کاراکتر موجود در زبان فارسی هنوز هم فاقد چنین واحدی هستند. البته در سال های اخیر پژوهش هایی در این زمینه آغاز شده است ولی هنوز نقاط ضعف بسیار زیادی وجود دارد. به دلیل اهمیت این موضوع در این پایان نامه به بررسی سیستم های تشخیص فونت فارسی بر اساس برخی از روش های محاسبات بعد فرکتالی پرداخته خواهد شد.

۱۵ صفحه ی اول