مجید یوسفی بابادی

نام پژوهشگر: مجید یوسفی بابادی

استخراج خطوط از تصاویر گرفته شده توسط دوربین های قابل حمل

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز 1388
مجید یوسفی بابادی شهرام جعفری

دسترسی روزافزون، کارایی بالا، و قیمت پایین دوربین های قابل حمل فرصت های بسیار زیادی را برای اخذ تصویر از اسناد نسبت به سایر ابزارهای سنتی تصویربرداری همچون اسکنرها فراهم می سازد. دوربین های دیجیتال که در تلفن های همراه و pdaها و ساعتهای مچی تعبیه شده اند، و همچنین دوربین های جدید عکس برداری و فیلم برداری دیجیتال از نظر سهولت استفاده و حمل قابلیت بالایی دارند. چنین قابلیت هایی کاربرد های زیادی را برای این سیستم ها ممکن می سازد که از جمله آنها می توان به آرشیو کردن اسناد، سیستم های تشخیص علایم، خواندن اتوماتیک کد کانتینرهای محموله و پلاک ماشین و ساختن وسایل کمکی برای افرادی که مشکل بینایی دارند اشاره کرد. استفاده از دوربین به جای اسکنر در سیستم های تشخیص متن چالش های جدیدی را پیش رو می گذارد. تفکیکپذیری پایین، پخشش غیر یکنواخت نور، پرسپکتیو، قرار گرفتن متون روی سطوح غیر یکنواخت، زاویه لنز، پس زمینه های پیچیده، بزرگ نمایی، فوکوس، حرکت تصویر نسبت به دوربین، شدت و گسسته سازی، یکسان سازی یا دانه بندی رنگ ها، نویزهای مربوط به حسگر، فشرده سازی و بار محاسباتی این سیستم ها همه از مشکلاتی هستند که هنگام روی آوردن به استفاده از دوربین های دیجیتال عادی در سیستم های تشخیص متن با آنها مواجه می شویم. نیاز به یک روش سریع و در عین حال مقاوم به خطا برای تحلیل تصاویر اسناد موضوعی است که در این تحقیق مد نظر قرار گرفته است. در این پایان نامه با استفاده از آنالیز موجک های چند مقیاسی، از یک روش جدید استخراج کلی به دقیق استفاده شده که قادر به استخراج خطوط متنی با پس زمینه های پیچیده می باشد. این روش همچنین قادر است روی متون مربوط به زبان های مختلف مانند انگلیسی، فارسی، چینی و مانند آنها اعمال شود. در روش ارائه شده، در مرحله اول یک الگوریتم استخراج کلی روی تصویر اعمال می شود. هدف از این مرحله استخراج ناحیه های کاندید وجود متن می باشد. این مرحله شامل آنالیز چند مقیاسی موجک، اعمال آستانه گیری بر روی تصویر انرژی موجک، فیلترینگ ساختاری، گسترش نواحی و کادر گذاری روی نواحی کاندید برای وجود متن می باشد. مرحله بعد تشخیص دقیق نام دارد. در این مرحله ابتدا چندین نوع ویژگی که نواحی متن را از غیر متن متمایز می سازند از درون کادرهای کاندید وجود متن استخراج می گردد و سپس با استفاده از طبقه بندی کننده های مناسب، کادرهای در بر گیرنده متن از دیگر کادرها جدا می گردند. طبقه بندی کننده هایی که برای این کار استفاده قرار گرفته اند عبارتند از شبکه های عصبی مصنوعی، svm و svm-svm. در پایان، برای ارزیابی روش ارائه شده، الگوریتم مربوطه روی تعداد نسبتا زیادی از تصاویر مختلف و چالش برانگیز اعمال شده و نتایج آن مورد بررسی قرار گرفته است.

۱۵ صفحه ی اول