نام پژوهشگر: سمانه السادات شیرازی

مطالعه و بررسی روشهای بازیابی تصاویر کلمات دستنویس
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده ریاضی و کامپیوتر 1385
  سمانه السادات شیرازی   محمدابراهیم شیری

در سالهای اخیر شناسایی نوری نویسه به عنوان یکی از حوزه های فعال در مبحث شناسایی الگو است. اگرچه تحقیقات بر روی کلمات دستنویس فارسی (عربی) در سالهای گذشته پیشرفت بسزایی کرده است، اما در مقایسه با کلمات لاتین جای پیشرفت دارد. البته کارهای انجام شده در این زمینه حاوی اطلاعات مفید برای بالا بردن ضریب اطمینان است. در این پایان نامه سعی بر این است که در حوزه شناسایی نوری نویسه و به خصوص کلمات دستنویس بتوان روشی برای بهبود دقت در شناسایی و بازیابی کلمات ارائه کرد. با توجه به این حقیقت که شناسایی یک تصویر به وسیله انسان ها بر اساس مشاهده صورت می گیرد، تمایز تصاویر گوناگون وابسته به قدرت بینایی انسان است. تحقیقات نشان داده است که درصد تشخیص و شناسایی یک شی در کامپیوتر با استفاده از تبدیل آن به فرکانس، برتر از شناسایی بر اساس ویژگی های ساختاری و ظاهری تصویر شئ می باشد. به همین منظور و در راستای شناسایی و بازیابی تصاویر دستنویس، از تبدیل موجک گسسته استفاده کرده و ویژگی های بدست آمده از این تبدیل را به عنوان معیار شناسایی و در نهایت بازیابی قرار داده ایم. سیستم شناسایی بر اساس شبکه های عصبی برنامه ریزی شده است. علت استفاده از شبکه عصبی، داشتن قابلیت دسته بندی کردن و تفکیک الگوها بر اساس ویژگی های مدنظر می باشد. مجموعه داده ها شامل 42 کلمه می باشد که توسط 100 نفر با درجه تحصیلات متفاوت جمع آوری شده است. نیمی از داده ها را به عنوان داده های آموزش و نیمی دیگر را به عنوان داده های آزمایشی در نظر گرفته ایم. سیستم شناسایی، داده های آموزشی را با دقت 95.71% و داد های آزمایشی را با دقت 72.85% شناسایی می کند. در بخش بازیابی تصاویر در مجموعه داده ها، سیستم پیشنهادی بطور متوسط برای 42 کلمه مفروض با دقت 97.80% به بازیابی می پردازد. به علت اینکه در داده های جمع آوری شده یک کلمه را به صورت پیوسته در نظر گرفته ایم و به شناسایی حروف به طور مجزا پرداخته نشده است، نتایج بدست آمده از آزمایش سیستم پیشنهادی نشان دهنده توانایی سیستم در بازیابی و همچنین شناسایی برون خط کلمات دستنویس فارسی دارد.