جداسازی خطوط در متون دست نویس فارسی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر
  • نویسنده عاطفه سهرابی
  • استاد راهنما سعید مظفری
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1391
چکیده

هدف این رساله، تقسیم بندی یک سند دستنویس به خطوط مجزا از یکدیگر است. جداسازی و استخراج خط، اولین و مهمترین مرحله پیش پردازش برای آنالیز و بازیابی تصویر یک سند است. هنگامی که یک خط جداسازی شد، (خط ایزوله شده) برای مراحل جداسازی کلمه، شناسایی آن، بازیابی زیرکلمات و حروف و سایر مراحلی که برای آنالیز یک سند مورد نیاز است، تحت بررسی قرار میگیرد. بنابراین استخراج صحیح خطوط، بمنظور درست انجام شدن سایر مراحل، دارای اهمیت فراوانی است. از طرفی جداسازی خطوط در اسناد دست نویس بدون محدودیت، به دلیل ویژگی های خاص این اسناد، یک مشکل اساسی است. تغییر در اندازه حروف، عدم وجود یک امتداد برای خط کرسی در سراسر یک خط، فاصله کم و متغیر بین خطوط و تماس و در هم فرو رفتگی خطوط مجاور و ... از جمله عواملی است که سبب میشود جداسازی خطوط با مشکلات زیادی مواجه گردد. در این رساله، ابتدا خط کرسی از یک خط با روش ورژن هموار شده نمودار منحنی طرح، تشخیص داده شده و سپس برای جداسازی کامل خط، به بررسی و نسبت دادن المانهای موجود بین دو خط مجاور، به یکی از خطوط فوقانی یا پایینی پرداخته می شود، تا بدین ترتیب خط، جداسازی و استخراج گردد. یکی از مراحل اساسی که در این رساله برای استخراج خط کرسی و تخصیص مولفه های بین خطوط، مورد استفاده است، بکارگیری مدل مارکوف مخفی است. نتایج بدست آمده برای جداسازی خطوط به روش گفته شده، در زبان فارسی 97.75 درصد و برای سایر زبان ها 98.25 بدست آمده است

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بازشناسی کلمات دست نویس فارسی بر اساس جداسازی بخش ها

در این تحقیق یک سیستم بازشناسی کلمات فارسی معرفی می شود که از خودهمبستگی محلی مرتبه بالای تصویر قطبی-لگاریتمی برای استخراج ویژگی از زیر- کلمات فارسی استفاده می کند. این شیوه ی استخراج ویژگی باعث می شود سیستم در مقابل تغییرات نگارشی مانند تغییر مقیاس های خطی و چرخش مقاوم شود. از مراحل مهم در یک سیتم بازشناسی کلمات، مرحله استخراج ویژگی می باشد. با توجه به این که کلمات دست نوشته دارای تغییرات نگار...

15 صفحه اول

تشخیص اعداد دست نویس فارسی

در این پایان نامه ما به ارائه یک روش مبتنی بر نمایش تنک برای تشخیص ارقام دست نویس فارسی می پردازیم. در سال های اخیر روش های مبتنی بر نمایش تنک توانسته اند به کارایی قابل توجهی در مسائل بینایی ماشین و پردازش تصویر دست یابند. چالش اصلی در طراحی یک طبقه بند مناسب برای تشخیص ارقام فارسی، مدل کردن زیرفضای داده ها و انجام عمل طبقه بندی بر اساس مدل ارائه شده است. رویکردی که در این پایان نامه برای تشخی...

یک روش جدید برای مکان یابی کلمات در متون تاریخی دست نویس فارسی

بازشناسی متون دستنویس یکی از مسائل مهم در حوزه ی بازشناسی الگوست که اگرچه در چند دهه ی اخیر، تحقیقات وسیعی روی آن صورت گرفته اما هنوز از برخی جهات به عنوان یک مسئله ی باز مطرح است. یکی از زمینه هایی که در بازشناسی متون دستنویس فارسی خیلی کم به آن پرداخته شده و جای پژوهش بسیار دارد، مکان یابی کلمات (word spotting) ، در متون تاریخی دست نویس است. اهمیت موضوع زمانی بهتر مشخص می شود که بدانیم در کشو...

تشخیص اعداد دست نویس فارسی به کمک شبکه های عصبی

دراین رساله پس از طرح مسئله تشخیص الگو، استفاده از شبکه های عصبی مصنوعی را به عنوان یک ابزار محاسباتی قوی در تشخیص الگو مورد بررسی قرار می دهیم. سپس از این شبکه ها جهت تشخیص اعداد و چهار عمل اصلی دست نویس فارسی توسط کامپیوتر استفاده خواهیم کرد که دراین راستا، بهینه سازی پارامترهای شبکه و بررسی اثر حذف و کوانتیزاسیون وزنهای شبکه مورد توجه قرار خواهند گرفت . بعد از مراحل فوق به یک شبکه عصبی بهینه...

15 صفحه اول

ارائه الگوریتمی برای تشخیص برخط دست نویس های فارسی

در این پژوهش یک سیستم عصبی- فازی با قابلیت آموزش همزمان برای بازشناسی برخط زیر-کلمات فارسی ارائه شده است. روش بازشناسی پیشنهادی یک روش کلی نگر بوده و مدل بازشناسی آن نیز، زیر-کلمه می باشد. در روش پیشنهادی ما، برای شناسایی زیر-کلمات از دانش مربوط به بدنه و علائم ثانویه آنها بطور همزمان استفاده می شود یعنی فرض می شود که بدنه ی زیر-کلمه و هر کدام از اجزای کوچک آن، در یک حرکت قلم نوشته می شود و بنا...

15 صفحه اول

بررسی فرآیند خوشنویسی در دست نویس های خطوط پهلوی، اوستایی و شکسته نستعلیق

در این رساله کوشش شده با گردآوری و گزینش منابع مکتوب و همچنین نسخه های مهم و شاخص از دست نویس های "پهلوی"، "اوستایی" و "شکسته نستعلیق" به بررسی فرآیند خوشنویسی در این خطوط پرداخته شود. اهمیت موضوع از این جهت است که بسیاری از آثار مکتوب و مدون خطوط پهلوی و اوستایی در دوران ساسانی و آغاز دوران اسلامی در ایران از میان رفته و دست نویس های باقی مانده از این خطوط بسیار پراکنده است. به همین دلیل پژوهش...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023