یک روش آماری برای ترکیب کلمات چندبخشی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی کامپیوتر
  • نویسنده آرزو ارجمندزاده
  • استاد راهنما مرتضی زاهدی
  • سال انتشار 1393
چکیده

زبان فارسی شامل کلماتی است که از چند بخش تشکیل شده اند و رسم الخط استاندارد این کلمات چندبخشی به این صورت هستند که باید میان تمام اجزاء آن نیم فاصله باشد تا به صورت یک جزء واحد شناسایی شوند. پیروی از این رسم الخط استاندارد فارسی در خوانا بودن متن فارسی نقش بسزایی دارد و خواننده می تواند درک درستی از مفهوم متن داشته باشد. علاوه برآن، در پردازش زبان طبیعی و ازجمله ترجمه ماشینی، مشخص بودن محدوده کلمات در کارایی سیستم تاثیر بسزایی دارد.

منابع مشابه

یک روش دو مرحلهای برای بازشناسی کلمات دستنوشته فارسی به کمک بلوکبندی تطبیقی گرادیان تصویر

This paper presented a two step method for offline handwritten Farsi word recognition. In first step, in order to improve the recognition accuracy and speed, an algorithm proposed for initial eliminating lexicon entries unlikely to match the input image. For lexicon reduction, the words of lexicon are clustered using ISOCLUS and Hierarchal clustering algorithm. Clustering is based on the featur...

متن کامل

یک الگوی چندبخشی و پویای برنامه ریزی نیروی انسانی برای برنامه سوم

هدف اساسی این مقاله تدوین و ارائه یک الگوی چند بخشی پویای برنامه ریزی نیروی انسانی است. نتایج تجربی درباره نیروی انسانی موردنیاز در طول برنامه سوم توسعه، برحسب گروههای شغلی، رشته های تحصیلی، و مقاطع تحصیلی است. نخست نتایج تجربی در «حل پایه» ارائه شده است. در حل پایه فرض گردیده که نرخ رشد برخی از متغیرهای عمده اقتصاد کلان برمبنای اهداف مندرج در برنامه سوم توسعه تعیین شود. محاسبات برمبنای الگوی پ...

متن کامل

ارائه روشی برای استخراج کلمات کلیدی و وزن‌دهی کلمات برای بهبود طبقه‌بندی متون فارسی

Due to ever-increasing information expansion and existing huge amount of unstructured documents, usage of keywords plays a very important role in information retrieval. Because of a manually-extraction of keywords faces various challenges, their automated extraction seems inevitable. In this research, it has been tried to use a thesaurus, (a structured word-net) to automatically extract them. A...

متن کامل

خاصیت ترکیب پذیری کلمات در ساختار گروه واژه های روسی

خاصیت ترکیب پذیری کلمات از جمله موضوعاتی است که در علم نحو روسی به هنگام بر رسی نحوهء ترکیب کلمات با یکدیگر مورد مطالعه و بررسی قرار می گیرد ویژگی ترکیب پذیری کلمات را می توان در دوسطح متفاوت زبان، یعنی در دو سطح معنا و دستور مشاهده نمود. زباشناسان روس خاصیت ترکیب پذیری کلمات را در درون "گروه واژه های وابستگی " مورد مطالعه و بررسی قرار داده و بر این اساس در درون تمامی گروه واژه های وابستگی، کلم...

متن کامل

ارائه مدلی مبنی بر ترکیب روش آماری عامل اطمینان و روش بگینگ به‌منظور اکتشاف آب زیرزمینی

با توجه به تغییرات اقلیمی و رشد جوامع شهری، نیاز به آب زیرزمینی و اکتشاف این منابع رو به افزایش است؛ بنابراین هدف از تحقیق حاضر، تهیه نقشه پتانسیل سطح آب زیرزمینی با استفاده از سیستم اطلاعات مکانی (GIS) در منطقه‌ای واقع در دشت بوشهر با استفاده از ترکیب روش آماری عامل اطمینان با روش داده‌کاوی بگینگ است. بدین منظور در گام اول، 339 موقعیت چاه در منطقه موردمطالعه مشخص گردید و به‌صورت تصادفی، 238 چا...

متن کامل

یک روش آماری جهت کوچک کردن تصویر با حفظ محتوا

این مقاله یک روش آماری جهت کوچک کردن تصویر با حفظ محتوا پیشنهاد می‌دهد. این روش با استفاده از یک شبکه یکنواخت اولیه تصویر را به ناحیه‌های مربعی یکسان تقسیم می‌کند و سپس با استفاده از نقشه اهمیت برای هر یک از این مربع‌ها یک ضریب اهمیت محاسبه می‌کند. نقشه اهمیت با استفاده از یک ترکیب جدید از چگالی لبه‌ها و نقشه برآمدگی هارل محاسبه می‌شود. الگوریتم پیشنهادی با استفاده از توابع آماری میانگین و واری...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023