پیش پردازش متون چاپی فارسی برای جداسازی حروف

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس
  • نویسنده
  • استاد راهنما
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1379
چکیده

پردازش مستندات یکی از جذاب ترین زمینه های بازشناسی الگو است و بازشناسی متون، محوری ترین بخش در پردازش مستندات است . یکی از مهمترین مراحل بازشناسی متون چاپی فارسی جداسازی حروف است . ما در این پایان نامه با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی است ، الگوریتم جداسازی مناسبی برای متون چاپی قدیمی ارائه کرده ایم. برای حل مشکل نایکنواختی کرسی خط، روش مناسبی برای تعیین نوار زمینه پیشتهاد کرده ایم و با اصلاح روش برچسب زنی کانتور بالایی و تکمیل قواعد جداسازی، دقت الگوریتم را برای متون قدیمی افزایش داده ایم. نرخ جداسازی درست حروف با استفاده از این الگوریتم برای یک مجموعه آزمایش که از متون قدیمی برگزیده شده است ، بدون هیچ پس پردازشی 97 درصد است . برای جداسازی نقاط چسبیده به بدنه حروف نیز روشی ارائه شده است که نتایج رضایت بخشی داده است .

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

پیش پردازش تصاویر متون فارسی دوربینی برای کاربردهای بازشناسی حروف

در این پایان نامه، روش هایی برای رفع اعوجاجات هندسی درتصاویر متون فارسی دوربینی ارائه می شود. روش های پیشنهادی شامل رفع انحنا، حذف کجی و پرسپکتیو در این تصاویر هستند. اساس کار در این روش ها به این صورت است که پس از مرحله پیش پردازش، ناحیه مربوط به هر خط متن تعیین و با اعمال تبدیل هندسی پرسپکتیو به روی تصویر، اعوجاجات هندسی آن حذف می شود. الگوریتم پیشنهادی اول، انحنا را برای اولین بار در تصاویر ...

15 صفحه اول

الگوریتم اصلاح شده جداسازی حروف متون چاپی با برچسب زدن به کانتور بالایی کلمات

در این مقاله با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی کلمات است، الگوریتم جداسازی مناسبی برای متون با کیفیت چاپی پایین ارائه شده است. برای حل مشکل نایکنواختی نوار زمینه خط،روش مناسبی برای تعیین نوار زمینه محلی پیشنهاد شده و با اصلاح روش بر چسب زنی کانتور بالایی وتکمیل قواعد جداسازی، دقت الگوریتم افزایش داده شده است. نرخ جداسازی درست حروف 97% است. بر اساس نتایج به دست آمده، بررسی دقیقی د...

متن کامل

جداسازی متون چاپی فارسی و لاتین در اسناد دو زبانه با استفاده از پردازش تصویر سند

امروزه حجم زیادی از اسناد کاغذی موجود، توسط جاروب گر ها یا دوربین ها به اسناد تصویری دیجیتالی تبدیل می شوند. ذخیره سازی، بازیابی و مدیریت کارآمد این شیوه های تصویری، در بسیاری از برنامه ها نظیر اتوماسیون اداری و کتابخانه های دیجیتالی اهمیت فراوانی دارند. برای تبدیل اسناد تصویری به اسناد متنی از سیستم های تشخیص اپتیکی حروف، ocr، استفاده می شود. سیستم های ocr تابع زبان متن بوده و با توجه به زبان ...

15 صفحه اول

حروف فارسی و عربی در نخستین کتاب‌های چاپی فارسی و عربی در جهان

هدف: ارتباطات سیاسی و اقتصادی بین خاورمیانه و غرب در عصر رنسانس، سبب چاپ کتاب به الفبای عربی در اروپا شد. این مقاله به تحول حروف چاپی در نخستین کتاب‌های چاپ شده به زبان‌های فارسی و عربی می پردازد.روش/ رویکرد پژوهش: این مقاله با استفاده از مواد کتابخانه‌ای وآرشیوی نوشته شده است.یافته‌ها: پیش از شروع چاپ در اروپا با استفاده از حروف متحرک عربی، ابتدا این کتاب‌ها به‌وسیله قالب‌های چوبی چاپ می‌شد. د...

متن کامل

بازشناسی متون چاپی فارسی

برای بازشناسی کلمات سه رویکرد مبتنی بر جداسازی، مبتنی بر بازشناسی کلمه یک الگوی واحد و رویکرد ترکیبی مطرح است . در این رساله یک سیستم برای بازشناسی متون چاپی فارسی با استفاده از رویکرد ترکیبی ارائه شده است . یک الگوریتم جدید برای جداسازی حروف در کلمات چاپی بدون توجه به نوع قلم ارائه شده است . مراحل مختلف الگوریتم شامل تعیین نوار زمینه، تصحیح آن و جداسازی حروف است . در تعیین نوار زمینه روش جدیدی...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023