بازشناسی کلمات دست نوشته با ویژگی های نوین و کاهش فرهنگ لغت

نویسندگان

  • سمیه برومند دانشجوی کارشناسی ارشد مهندسی کامپیوتر، گرایش علوم تصمیم و مهندسی دانش، دانشگاه آزاد اسلامی واحد مبارکه
چکیده مقاله:

بازشناسی کلمات دست‌نوشته و تبدیل آن به متن تایپی معادل می‌ تواند در تفسیر دست‌نوشته و جستجو در اسناد بسیار حائز اهمیت باشد. در این مقاله سیستمی به منظور تشخیص برون‌ خط دست‌ نوشته فارسی در یک فرهنگ لغت محدود معرفی شده است. به منظور استخراج ویژگی، بعد از بلوک ‌بندی تصویر ورودی و استخراج مرکز هر بلوک توسط مرکز ثقل، میانگین مرکز اجزای متصل از الگوریتم سیفت متراکم استفاده شده است. از روش آنالیز تفکیک‌ کننده خطی برای کاهش تعداد ویژگی‌ ها استفاده شده است. در این مقاله، در مرحله نخست کلمات موجود در فرهنگ لغت بر اساس شباهت با استفاده از الگوریتم ISOCLUSE به همراه الگوریتم سلسله ‌مراتبی خوشه ‌بندی شده است. میانگین هر خوشه در فضای ویژگی به عنوان نماینده آن خوشه و مدخل مشترک اعضای آن خوشه در فرهنگ لغت تصویری، در نظر گرفته شده است. در مرحله دوم به منظور بازشناسی کلمه ‌ی جدید  از کلمات کاندید، از روش ماشین ‌بردار ‌پشتیبان به صورت چندکلاسه و دو‌کلاسه استفاده شده است. نتایج بدست آمده نشان دهنده عملکرد بهتر روش ماشین‌ بردار ‌پشتیبان دو‌کلاسه از لحاظ سرعت و دقت بر روی مجموعه داده ایران‌شهر می‌ باشد. در مرحله بازشناسی با انتخاب 5 خوشه نزدیک به کلمه دست‌نوشته مورد آزمون با دقت 93.37% حدود 76.65% از کلمات مورد بررسی کاهش خواهد یافت.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

دست نوشته های اسماعیلیان بدخشان

در دور دست‌ها ، پهلو به پهلوی چین ، باریکه سرزمینی است ،‌‌ بسیار مرتفع ، با کوه‌های آسمان بوس و به هم فشرده‌ ، با معبرهای تنگ دشوار گذر، با زمستان‌های سرد نه ‌ماهه‌ ، برخوردگاه چهار تمدن بزرگ آسیا‌: ایران‌، هند‌، چین و آسیای مرکزی که دورترین نقطه است نسبت به همه‌ی آنها و پناهگاهی است امن برای رانده‌شدگان از سراسر این سرزمین‌ها ،نه تنها کسان که حتی باورها و اندیشه‌های کهن ، نه در کنار‌هم که آمیخ...

متن کامل

بازشناسی برون خط کلمات دست نوشته فارسی در یک مجموعه ای از لغات

در این پایان نامه بازشناسی برون خط کلمات دست نوشته فارسی در یک فرهنگ لغت محدود مورد مطالعه قرار می گیرد. برای این منظور یک روش دو مرحله ای پیشنهاد می گردد. در مرحله نخست توسط الگوریتم های خوشه بندی سلسله مراتبی وisoclus کلمات موجود در فرهنگ لغت بر اساس تشابه خوشه بندی می شوند. ویژگی های تشابهی به کار رفته در این مرحله، بردارهای پروفایل بالا، پایین، پروژکشن عمودی و تعداد گذر از سیاه به سفید برای...

15 صفحه اول

مدل‌سازی بازشناسی واجی کلمات فارسی

Abstract of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underly...

متن کامل

بررسی استفاده از رایانه، تلفن همراه و فرهنگ لغت در یادگیری لغت های زبان انگلیسی

درباره‌ی اثربخشی روش‌های نوین یادگیری بلندمدت لغات انگلیسی تاکنون بررسی چندانی صورت نگرفته است. پژوهش حاضر با هدف بررسی مقایسه‌یی آموزش ۳۳۰ لغت در فهرست لغات آکادمیک C‌o‌x‌h‌e‌a‌d )۲۰۰۰(، با استفاده از رایانه، تلفن همراه و فرهنگ لغت در حوزه‌ی یادگیری بلندمدت زبان‌آموزان در ایران، انجام شده است. در این راستا پس از برگزاری آزمون تعیین سطح آکسفورد به‌عنوان آزمون مهارت، ۲۶۴ زبان‌آموز در رشته‌های عل...

متن کامل

بازشناسی بر خط و بدون محدودیت دست نوشته فارسی

بازشناسی برخط نوشتار یکی از دشوارترین زمینه های شناسایی الگو و هوش مصنوعی بوده و همواره مورد توجه خاص محققان قرار گرفته است. پیچیدگی این زمینه, هنگام برخورد با زبان هایی مثل فارسی و عربی که حروف آن ها باتوجه به موقعیت شان در کلمه, شکل های متفاوتی به خود می گیرند, دوچندان می شود. تحلیل دست نوشته ی فارسی یا عربی در مقایسه با زبان های لاتین، به علت حضور اجزای کوچکی ("نقطه", "دونقطه" و ...) بالا یا...

15 صفحه اول

بازشناسی کلمات دست نویس فارسی بر اساس جداسازی بخش ها

در این تحقیق یک سیستم بازشناسی کلمات فارسی معرفی می شود که از خودهمبستگی محلی مرتبه بالای تصویر قطبی-لگاریتمی برای استخراج ویژگی از زیر- کلمات فارسی استفاده می کند. این شیوه ی استخراج ویژگی باعث می شود سیستم در مقابل تغییرات نگارشی مانند تغییر مقیاس های خطی و چرخش مقاوم شود. از مراحل مهم در یک سیتم بازشناسی کلمات، مرحله استخراج ویژگی می باشد. با توجه به این که کلمات دست نوشته دارای تغییرات نگار...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 4  شماره 2

صفحات  35- 47

تاریخ انتشار 2017-11-22

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023