ویرایش‌گر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی

نویسندگان

  • سلطانزاده, فاطمه دانشگاه صنعتی شریف
  • مرادی, مهدی دانشگاه صنعتی شریف
  • مهدوی, محسن دانشگاه صنعتی شریف
چکیده مقاله:

In this paper, we will introduce an intelligent system to edit and spell check Persian texts. The goal is editing and preprocessing Persian texts for natural language processing tasks. This system is based on an expandable and engineering approach and is composed of three subsystems: Persian text editor, spell checker and stemmer. These parts interact with each other to edit texts. To do this, the stemmer subsystem process each word in the text if the subsystem could not find a stem in the lexicon, the word will be recognized as an incorrect word. Then, the spell checker provides a list of suggestions to correct the wrong word. Subsequently, the editor subsystem edits the text based on the standards of the Academy of Persian Language and Literature. Our evaluation shows nearly 92%, 95% and 96% precision numbers for editor, stemmer and spell checker subsystems, respectively.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ویرایش گر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی

در مقالۀ حاضر سامانه ای هوشمند جهت ویرایش و خطایابی املایی متون فارسی معرفی شده است. هدف از طراحی و ایجاد این سامانه، ویرایش متون فارسی برای کاربردهای پردازش زبان طبیعی است. این سامانه بر مبنای یک رویکرد مهندسی قابل توسعه، از سه زیرسامانه تشکیل شده است: ویرایش گر متن فارسی معیار، خطایاب املایی خودکار زبان فارسی و ستاک یاب واژگان زبان فارسی. این سه بخش با یکدیگر در تعاملند؛ بدین شکل که ابتدا ستا...

متن کامل

تأملی در ویژگی‌های زبانی و املایی نسخۀ خطی نخستین شرح کامل مثنوی به زبان فارسی در آسیای صغیر

زبان فارسی و فرهنگ ایران همواره مشتاقانی در جهان داشته است و بخش‌هایی مانند آناتولی و منطقۀ بالکان، بسیار از این زبان و فرهنگ تأثیر پذیرفته‌اند. فارسی‌آموزی، نسخه‌برداری آثار علمی و ادبی، ترجمه، تصحیح و شرح متون فارسی، وجود نسخه‌های خطی بی‌شمار از آثار کهن ایرانی در کتابخانه‌های بزرگ دنیا و توجه محققان و مصححان غیرایرانی به بازآفرینی این متون، نشانه‌هایی از نفوذ فرهنگ ایرانی و زبان فارسی در جها...

متن کامل

سامانۀ رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالب‌های معنایی

رفع ابهام معنایی از کلمات در بافت یکی از مهم‌ترین چالش‌ها در حوزۀ پردازش زبان طبیعی و زبان‌شناسی رایانشی است. در این میان حروف اضافه، به‌خصوص در زبان فارسی، در پژوهش‌های مربوط به رفع ابهام معنایی همواره نادیده انگاشته شده‌اند. ازاین‌رو، پژوهش حاضر قصد دارد با ارائۀ الگوریتمی جدید مبتنی بر قالب‌های معنایی، سامانه‌ای قاعده‌مند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فار...

متن کامل

رویکردی انتقادی به سرفصل‌های مربوط به نگارش و ویرایش در برنامة درسی دورة کارشناسی زبان و ادبیات فارسی

این پژوهش به بررسی کارآمدی سرفصل دروس «آیین نگارش و ویرایش» و «کارگاه ویراستاری (1) و (2)» در برنامة درسی مقطع کارشناسی زبان و ادبیات فارسی نظر دارد. این دروس در برنامة درسی مدّنظر جنبة کاربردی دارند و ضمن تقویت مهارت‌های نویسندگی، فراگیر را برای پذیرش زمینه‌های شغلی در جامعه آماده می‌کنند. در پژوهش پیشِ رو این دروس با توجه به شاخص‌های شورای برنامه‌ریزی آموزش عالی بررسی می‌شوند. نتایج این بررسی ن...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 12  شماره 4

صفحات  43- 52

تاریخ انتشار 2016-03

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023