شناسایی کلمات فارسی تایپی در تصاویر درجه تفکیک پایین

پایان نامه
چکیده

برای بازشناسی زیرکلمات فارسی سه رویکرد مبتنی بر جداسازی به حروف، مبتنی بر شکل کلی زیرکلمه و ترکیبی از این دو وجود دارد. در بسیاری از سازمان ها، تصاویر نامه ها با درجـه تفکـیک 150 نقطه بر اینچ و کمتر ذخیره می شوند. متنی با این درجه تفکـیک برای خواندن توسط کاربر انسانی مناسب است اما برای بازشناسی توسط سیستم شناسایی نوری کلمات این درجه تفکیک بسیار کم به نظر می رسد. حتی سیستم های شناسایی نوری کلمات لاتین هم غالبا برای 300 نقطه بر اینچ، توسعه یافته اند. در درجـه ی تفکـیک پایین ، جـداسازی به سخـتی امکان پذیر است و باید از روش هایی مانند شکل کلی استفاده نمود. در این پایان نامه به بررسی و بازشناسی زیرکلمات فارسی با درجـه تفکـیک 96 نقطه بر اینچ می پردازیم که برای این منظور از شکل کلی زیرکلمات برای بازشناسی آنها بهره برده ایم. سیستمی که در اینجا برای بازشناسی زیرکلمات فارسی ارائه شده مبتنی بر یک روش سه مرحله ای است . در مرحله نخست به کمک خوشه بندی، دامنه ی جستجوی تصاویر زیرکلمات موجود در فرهنگ لغت کاهش داده شده که این کار نه تنـها سرعت سیستم را بالا می برد بلکه دقت را نیز افزایش می دهد، در مرحله دوم بازشناسی، با استفاده از یک طبقه بند، 4 خوشه ی نزدیک به زیرکلمه ی آزمون ورودی تشخیص داده می شود و پس از آن با جستجو در میان آن خوشه های هدف، 10 نزدیک ترین زیرکلمات موجود در فرهنگ لغت، به زیرکلمه ی آزمون را می یابیم، این روند برای تمام زیرکلمات یک کلمه تکرار شده سپس در مرحله ی سوم با استفاده از روش رخدادهای محتمل برای توالی زیرکلمات، کلمه ی آزمون تشخیص داده می شود. دقت این الگوریتم بازشناسی بسیار مناسب تخمین زده می شود و قابلیت بازشناسی 098/01 % در کلماتی که از بیش از یک زیرکلمه تشکیل شده اند را داراست و کلماتی که صرفاً، تک زیرکلمه ای اند را با دقت 82/53 % بازشناسی می کند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مدل‌سازی بازشناسی واجی کلمات فارسی

Abstract of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underly...

متن کامل

ساخت موضوعی کلمات مشتق در زبان فارسی

ساخت موضوعـی بـه فهرست موضوع‌هـای یک محمـول اطلاق می‌شود. مثلاً، فعل «خورد» دو موضوع و فعل «داد» سه موضوع در ساخت موضوعی خود دارد. معمولاً ساخت موضوعی افعال پس از افزوده‌شدن یک وند اشتقاقی به آنها تغییر می‌کند، به‌گونه‌ای که ساخت موضوعی مشتق حاصله با ساخت موضوعی کلمۀ پایه متفاوت است. در مقالة حاضر، ساخت موضوعی مشتقات فعلی زبان فارسی و تأثیر وند افزایی بر ساخت موضوعی کلمة پایه را مطالعه می‌کنیم. چ...

متن کامل

کلمات مرکبِ «انعکاسی» در فارسی: انگارۀ دستوری‌شدگی

انعکاسی‌ها در مطالعات زبان‌شناسی به آن دسته از واحدهای زبانی اطلاق می‌شوند که به‌دلیلِ رمزگذاری هم‌مرجع‌بودگی میان فاعل و موضوع دیگر فعل (مفعول مستقیم یا غیرمستقیم) یا تأکید برگروه اسمی در جمله به‌کار گرفته می‌شوند. مختصر حاضر بر آن است تا به بررسی آن دسته از کلمات مرکب در زبان فارسی بپردازد که با عناصر انعکاسیِ: «خویش» و «خویشتن» و عنصر انعکاسی و انعکاسیِ تأکیدیِ «خود» پدید می‌آیند. این بررسی با ه...

متن کامل

شناسایی اهداف با استفاده از تلفیق تصاویر فراطیفی و تصاویر با قدرت تفکیک مکانی بالا

شناسایی، ماموریتی برای کسب اطلاعات در مورد فعالیت ها، منابع، توانمدی ها و موقعیت دشمن است. شناسایی اهداف نظامی می تواند اطلاعاتی پیرامون وضعیت فعالیت ها، استقرار نیروها، آرایش نظامی و بسیاری از اطلاعات گوناگون دیگر از یک محدوده نظامی را در اختیار فرماندهان قرار دهد. در سال های اخیر پیشرفت تکنولوژی در زمینه سنجش از دور امکان تهیه تصاویر مختلف با قدرت تفکیک طیفی و مکانی بالا را فراهم نموده است. ت...

متن کامل

نهان نگاری اطلاعات در تصاویر متون تایپی فارسی با استفاده از تئوری فرکتال

در این پایان نامه یک روش جدید برای کدینگ فرکتالی تصاویر باینری ارائه شده است که تصویر کد شده را با کیفیت بسیار مناسب و سرعت کدینگ خوبی ایجاد می کند. همین طور راه کارهایی برای افزایش سرعت کدینگ ارائه شده که سرعت آن را تا حد زیادی افزایش می دهد. کدینگ فرکتالی ارائه شده همچنین امکان جاسازی واترمارک را در کدهای فرکتالی فراهم می کند. کدینگ فرکتالی بر روی تصویر میزبان اعمال شده و کدهای فرکتال آن ذخیر...

15 صفحه اول

اثر خطای زمین مرجع نمودن بر روی بازتابندگی در تصاویر با قدرت تفکیک مکانی پایین در مناطق شهری

زمین مرجع نمودن تصاویر ماهواره‌ای یکی از مراحل ضروری و اولیه در بسیاری از پردازش‌های سنجش از دوری است. این موضوع در تصاویر با قدرت تفکیک مکانی پایین، به دلیل دشواری در تعیین دقیق نقاط کنترل، نسبت به تصاویر با قدرت تفکیک مکانی بالا از دقت کمتری برخوردار است. هنگام استفاده از این تصاویر در مناطق شهری به دلیل پیچیدگی سطح شهر و وجود کلاس‌های مختلف در هر پیکسل (وجود پیکسل‌های مختلط) زمین مرجع نمودن ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق و الکترونیک

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023