طبقه بندی کلمات متن تایپی فارسی - انگلیسی بر حسب نوع قلم، در قالب نظریه بیزی، و با استفاده از ویژگی های فیلتر گابور

پایان نامه
چکیده

طبقه¬بندی کلمات در متون تایپی برحسب نوع قلم، کاربردهای فراوانی در پردازش اتوماتیک اسناد و نوشته¬ها دارد که در دنیای امروز هم رایج شده و هم ضروری به نظر می¬رسد. در این میان، نفس عمل طبقه¬بندی از هر نوع که باشد در افزایش دقت و بهبود عملکرد کل مسأله به شدت موثر خواهد بود. مثالی از این دست می¬تواند طبقه¬بندی کلمات یک صفحه از لعت¬نامه¬ای باشد که هر نوع قلم، اطلاعات جانبی مختلفی را در مورد کلمه مذکور نمایان سازد: قلم ضخیم نشانه شروع یک مدخل جدید باشد و قلم مایل جایگاه دستور زبانی کلمه. قلم عادی با فونت کوچک اطلاحات را مشخص می¬کند و قلم عادی با فونت بزرگتر، معنی را. آنچه در این پروژه بدان پرداخته شده است، پیاده سازی الگوریتمی در طبقه¬بندی کلمات یک متن تایپی، برحسب نوع قلم نگارش آن است. بنابراین فرض می¬شود که کلمات متن مورد نظر با یکی از چهار نوع قلم عادی، مایل، ضخیم، و مایل ضخیم، نوشته شده¬اند و هدف، طبقه¬بندی آنهاست. از دیدگاه کلی، هدف پروژه، یافتن یک توزیع احتمال است که پارامترهای آن، توصیف کننده کلاس¬های مورد نظر در مسأله فیزیکی¬اند. کل روند تحقیق در سه بخش قابل پردازش است. بخش اول، توصیف فیزیک مسأله به فضای ریاضی ویژگی¬هاست. بخش دوم، انتخاب توزیع احتمالی برای مدل کردن فضای به دست آمده است، و بالاخره بخش سوم، به کارگیری روشی برای تخمین پارامترهای مدل احتمال مذکور. پیداست که از نظر موضوعی، در دسته تخمین¬ مدل¬های احتمال پارامتری جای داریم. به این موضوع، قالب بیزی هم اضافه می¬شود، و پارامترهای مدل احتمال، متغیرهای تصادفی با توزیع احتمال پیشین فرض می¬شوند. با این زمینه، تکیه اصلی بر الگوریتمی تکرارشونده در زمینه تقریب¬های توزیعی است که همراه با یک مدل توزیع احتمال جدید، زیربنای تحلیلی پروژه را تشکیل می¬دهند. منظری که از ابتدا تا انتهای این نوشته، سعی در توصیف آن داریم، در واقع ارتباط این دو مورد است، «تا که قبول افتد و که در نظر آید».

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تشخیص چهره با استفاده از PCA و فیلتر گابور

Methods for face recognition which are based on face structure are among techniques without supervision and produce unfavorable results in the presence of linear changes in images. PCA is a linear transform and a powerful tool for data analysis but does not produce good results for face recognition when there are non-linear changes resulting from changes in position, intensity and gesture in th...

متن کامل

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

طبقه ‌بندی ضایعات پستان در تصاویر رزونانس مغناطیسی با استفاده از روش جداسازی مبتنی بر Level Set و استخراج ویژگی گابور- هارالیک

مقدمه: سرطان پستان را می ­توان شایع ­ترین سرطان در میان زنان جهان نامید. از این رو یافتن راه­ هایی برای تشخیص و درمان این بیماری یک چالش مهم در سلامت جامعه بشری می­ باشد. روش ­های مختلفی به منظور غربالگری پستان در زنان معرفی شده ­است که از جمله کم­ خطرترین این روش­ ها می­ توان به تصویربرداری تشدید مغناطیسی اشاره کرد. ضایعات پستان دارای خصوصیات ظاهری مختص به خود نیستند بنابراین تفکیک خوش­خیم و ب...

متن کامل

طبقه بندی زعفران با استفاده از ویژگی های رنگی استخراج شده از تصویر

طبقه­بندی زعفران به عنوان گران­ترین ادویه از اهمیت بالایی برای مشتریان و تجار برخوردار است. به طور کلی، در حال حاضر دو روش برای درجه­بندی زعفران استفاده می­شود. روش اول براساس تجربیات فرد خبره و با مشاهده نمونه­ها انجام می­شود. روش دوم تخریبی بوده و با استفاده از متدهای آزمایشگاهی انجام می­گیرد. طبق نظر متخصصان، استفاده از تکنیک­های یادگیری ماشین برای طبقه­بندی زعفران به دلیل داشتن ماهیت غیر مخ...

متن کامل

بازشناسی متن تایپی نوشته شده با قلم iranian sans

در این پایان نامه هدف، بازشناسی متن تایپی نوشته شده با قلم iranian sans ، با حداقل اندازه 9 و درجه تفکیک 300 نقطه بر اینچ است. این قلم با توجه به دو خصوصیت زیبایی و خوانایی، بسیار مورد توجه واقع شده و روز به روز بر حجم استفاده از آن در محیط رایانه و اینترنت افزوده می شود. این قلم قابلیت جایگزینی با قلم تاهما که قلم پیش فرض سیستم عامل ویندوز است، را دارد. علیرغم خوانایی، فاصله استاندارد بین سطره...

طبقه بندی ضایعه های پوستی از روی تصاویر درموسکپی با استفاده از ویژگی های رنگ و شکل

در این پژوهش الگوریتم جدیدی برای طبقه‌بندی تصاویر درموسکپی به دو نوع بدخیم و خوش‌خیم ارائه شده است. ابتدا یک مرحله پیش‌پردازش دو مرحله‌ای شامل فیلترگذاری جهت حذف نویز و فیلتر همومورفیک جهت ارتقاء کیفیت تصویر اعمال می‌شود. سپس با استفاده از روش آستانه‌گذاری Otsu ضایعه از نواحی سالم جدا می‌شود. سپس ویژگی‌های شکل و رنگ از تصویر قطعه‌بندی شده، استخراج می‌شود. ویژگی های رنگ مبتنی بر ممان‌های ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023