نام پژوهشگر: عاطفه سهرابی

جداسازی خطوط در متون دست نویس فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر 1391
  عاطفه سهرابی   سعید مظفری

هدف این رساله، تقسیم بندی یک سند دستنویس به خطوط مجزا از یکدیگر است. جداسازی و استخراج خط، اولین و مهمترین مرحله پیش پردازش برای آنالیز و بازیابی تصویر یک سند است. هنگامی که یک خط جداسازی شد، (خط ایزوله شده) برای مراحل جداسازی کلمه، شناسایی آن، بازیابی زیرکلمات و حروف و سایر مراحلی که برای آنالیز یک سند مورد نیاز است، تحت بررسی قرار میگیرد. بنابراین استخراج صحیح خطوط، بمنظور درست انجام شدن سایر مراحل، دارای اهمیت فراوانی است. از طرفی جداسازی خطوط در اسناد دست نویس بدون محدودیت، به دلیل ویژگی های خاص این اسناد، یک مشکل اساسی است. تغییر در اندازه حروف، عدم وجود یک امتداد برای خط کرسی در سراسر یک خط، فاصله کم و متغیر بین خطوط و تماس و در هم فرو رفتگی خطوط مجاور و ... از جمله عواملی است که سبب میشود جداسازی خطوط با مشکلات زیادی مواجه گردد. در این رساله، ابتدا خط کرسی از یک خط با روش ورژن هموار شده نمودار منحنی طرح، تشخیص داده شده و سپس برای جداسازی کامل خط، به بررسی و نسبت دادن المانهای موجود بین دو خط مجاور، به یکی از خطوط فوقانی یا پایینی پرداخته می شود، تا بدین ترتیب خط، جداسازی و استخراج گردد. یکی از مراحل اساسی که در این رساله برای استخراج خط کرسی و تخصیص مولفه های بین خطوط، مورد استفاده است، بکارگیری مدل مارکوف مخفی است. نتایج بدست آمده برای جداسازی خطوط به روش گفته شده، در زبان فارسی 97.75 درصد و برای سایر زبان ها 98.25 بدست آمده است