استخراج نواحی متن از تصاویر طبیعی

پایان نامه
چکیده

حس بینایی درگاه ورود اطلاعات فراوان و در نتیجه افزایش کارایی سیستم می باشد. یکی از علومی که در راستای افزایش کارایی حس بینایی در سیستم های هوشمند به کار گرفته می شود، علم ماشین بینایی است. کشف و استخراج متن در تصویر یکی از مسائل بسیار مهم در زمینه ماشین بینایی می باشد. یکی از علوم مهمی که باعث افزایش درک مفهوم تصاویر متن دار برای سیستم می شود، استخراج متن آن است. بطور کلی متن، وزن زیادی از مفهوم تصویر را به همراه دارد، که با استخراج و تشخیص آن سیستم می تواند تصمیم گیری بهتری، در راستای رسیدن به هدف مورد نظر داشته باشد. جملات متن در یک تصویر می تواند از نظر فونت، اندازه، جهت و رنگ متفاوت باشند. همچنین در پس زمینه متن می توان اشیاء مختلف با رنگ های متفاوت وجود داشته باشند که باعث پیچیدگی پس زمینه گردند. در این تحقیق الگوریتم هایی ارائه شده است که می تواند مکان متن را در تصاویری با پیچیدگی زیاد مشخص کند. تصاویر مورد استفاده در این پژوهش از نوع تصاویر ثابت (عکس) هستند. یکی از پارامترهایی که اطلاعات خوبی از تصویر را نگه می دارد، لبه ها هستند که با انجام عملیات لبه گیری، می توان بیشتر مشخصه های متنی را در تصویر را کشف و با درصد اطمینان بالایی مکان متن را تشخیص داد. در این تحقیق تکنیک های مختلف استخراج متن از تصویر مبتنی بر ویژگی های مکانی و فرکانسی مورد بررسی قرار گرفته است. سپس روش پیشنهادی که بر مبنای ویژگی های مکانی متن طراحی شده است به صورت دو قسمت الگوریتم اولیه و نهایی ارائه شده است. الگوریتم اولیه شامل سه مرحله پیش پردازش، تشخیص لبه و حذف لبه های نا مطلوب می باشد. در مرحله پیش پردازش به کمک فیلتر wiener و ماسک unsharp ، تصویر ورودی نرم و لبه های آن برجسته می شود. پس از این مرحله، با استفاده از روش sobel ، به تشخیص لبه های متن می پردازد. این لبه ها را می توان به دو دسته لبه متنی (مطلوب) و لبه غیرمتنی (نا مطلوب) گروه بندی کرد که در قسمت حذف لبه های نا مطلوب به جداسازی این دو گروه پرداخته می شود. مرحله آخر شامل به کارگیری ابزارهای مورفولوژی و چندین شرط، که بر اساس ویژگی های مکانی متن و یک سری قوانین از پیش تعیین شده طراحی شده اند، می شود. این الگوریتم دارای بدنه ای ساده است که بر روی تصاویری با پیچیدگی کمتر دارای عملکرد مطلوبی می باشد. الگوریتم نهایی که ساختار جدیدی دارد، به صورت محلی بر روی تصویر اعمال می شود. در این روش لبه های تصویر را به این صورت تعریف می کنیم که تصویر مجموعه ای از لبه های منظم متن و لبه های غیر منظم غیرمتنی می باشد. بر اساس این تعریف، لبه هایی از تصویر که از نظر اندازه و فاصله مشابه می باشند در یک گروه(گروه کاندید متن) قرار گرفته و پردازش بر روی این گروه اعمال می شود. با استفاده از این ایده می توان لبه های منظم را از بین لبه های غیرمنظم تصویر پیدا کرد. برای پیاده سازی این الگوریتم، پس از حذف یک سری از لبه های نامطلوب، بقیه لبه ها براساس معیارهای اندازه و فاصله ناحیه بندی می شوند. آنگاه هر ناحیه بصورت محلی و مستقل از دیگر نواحی پردازش می گردند. در انتها نیز نواحی باقیمانده وارد بلوک جداساز نهایی می شوند. این بلوک شامل سه روش برای جداسازی بهتر نواحی متنی از غیرمتنی می باشد که شامل دو روش اصلی تئوری فازی و شبکه آستانه گذاری به همراه یک روش کمکی wavelet می شود. در نهایت آن قسمت هایی از تصویر که دارای مشخصات و نظم با خواص متنی بیشتری باشند باقی می مانند. روش مطرح شده بر روی چندین تصویر استاندارد اعمال شده و توسط معیارهای نرخ دقت و نرخ فراخوانی مورد ارزیابی قرار گرفته است. نتایج بدست آمده حاکی از بهبودی قابل ملاحظه روش ارائه شده نسبت به روش های موجود می باشد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

استخراج متن از تصاویر صحنه های طبیعی

استخراج متن موجود در تصاویر صحنه های طبیعی، امروزه مورد توجه محققین زیادی قرارگرفته است. محتوای صحنه می تواند به دو طبقه مهم تقسیم بندی شود. محتوای ادراکی و محتوای معنایی. محتوای ادراکی شامل خصوصیات رنگ، شکل و بافت صحنه می باشد. در مقابل محتوای معنایی شامل متن، چهره، رفتارها و حرکات انسان است. در میان اطلاعات مختلف موجود در صحنه، اطلاعات متنی از اهمیت ویژ ه ای برخوردارند، چرا که به آسانی توسط ا...

15 صفحه اول

استخراج متن چاپی از تصاویر گرافیکی

در این پایان نامه ، برای اولین بار روشی برای جداسازی متن چاپی فارسی از تصاویر گرافیکی ارائه شده است . جدولها ، روندنماها و نقشه ها از جمله تصویرهای گرافیکی هستند. این روش از سه مرحله تشکیل شده است . در مرحله اول عناصر گرافیکی شاخص با توجه به برخی ویژگیهای تصویری آنها جدا می شوند. در مرحله دوم متن های چسبیده به عناصر گرافیکی آشکار و جدا می شوند. در مرحله سوم ، با استفاده از طبقه بندی حداقل فاصله...

15 صفحه اول

استخراج متن از تصاویر در صحنه های طبیعی مبتنی بر ویژگی های آماری

در این پایان نامه روشی برای تشخیص متن در تصاویر مختلف طبیعی پیشنهاد شده است. در ابتدا کلیه تصاویر با پنجره های ۱۶×۱۶ بدون هم پوشانی مورد برسی قرارگرفته و ماتریس مشخص شده با عملگر hog استخراج می شود و پس ازاین مرحله با توجه به تعداد نسبتا مناسب ویژگی ها، مجموعا 40 ویژگی که برای هر بلوک در یک بردار 40 تایی ذخیره و با سه حالت روی نویسه، داخل نویسه و یا منطقه کاملا مستقل مشخص شده و مجموع پنجره های ...

15 صفحه اول

تصاویر نو از یک متن اصلی

این مقاله ترجمه را به عنوان یک "اتاق تاریک" معرفی می‌کند که جنبه‌های تجربی متن اصلی را نمایان می‌سازد و آنها را از نامرئی بودن رهایی می‌بخشد. ترجمه همچون یک فرایند عکاسی است در یک اتاق تاریک که متن اصلی را در زاویه‌ای نو ظاهر می‌کند. برای اثبات این مطلب در این مقاله خواهیم دید چگونه ویژگی‌های نوشتاری مخصوص چارلز دیکنز، تبدیل کردن ذهنیتهایش به عینیت و جان دادن به شخصیتها در یک ترجمه به زبان فران...

متن کامل

تشخیص ملانوما به کمک استخراج ویژگیهای مناسب از تصاویر درماتوسکوپی

خلاصهزمینه و هدفپوست جلوگیری نمایدمیپذیرد، ارائه روشی که تشخیص ملانوما را در مراحل اولیه آسان نماید بسیار مفید و ارزنده است: تشخیص ملانوما در مراحل نخست بیماری میتواند بطور چشمگیری از مرگ ناشی از این سرطان مهلک. از آنجایی که تشخیص این بیماری در مراحل نخست، حتی توسط پزشکان کارآمد به سختی انجام.روش بررسیبپردازیم که به تشخیص ملانوما کمک نمایدکمک فیلتر پلاریزه شبی هسازی شده با زاویه مناسب انجام پذی...

متن کامل

روش نوین استخراج مدل شبکه حفرات از تصاویر سی‌تی‌اسکن سه‌بعدی

هندسه‌ی سنگ مخزن یکی از مهم‌ترین عوامل تأثیرگذار در آنالیز خواص ایستا و پویا در سنگ مخزن است. از تصاویر سی‌تی‌اسکن برای به بصری-سازی هندسه‌ی داخلی سنگ مخزن استفاده می‌شود. این تصاویر به صورت مستقیم برای انجام محاسبات مناسب نیستند. مدل‌های شبکه‌ حفرات برای تبدیل این هندسه به مختصات ریاضی استفاده می‌شود. استخراج این مدل‌ها از تصاویر سی‌تی‌اسکن با استفاده از روش‌های آماری- احتمالی مبتنی بر پردازش ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه مازندران

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023