سامانۀ رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالب‌های معنایی

نویسندگان

  • زهرا مظفری دانشجوی دکترای زبان‌شناسی همگانی، دانشگاه سیستان و بلوچستان
  • گیتی تاکی استادیار زبان و ادبیات انگلیسی، دانشگاه سیستان و بلوچستان
چکیده مقاله:

رفع ابهام معنایی از کلمات در بافت یکی از مهم‌ترین چالش‌ها در حوزۀ پردازش زبان طبیعی و زبان‌شناسی رایانشی است. در این میان حروف اضافه، به‌خصوص در زبان فارسی، در پژوهش‌های مربوط به رفع ابهام معنایی همواره نادیده انگاشته شده‌اند. ازاین‌رو، پژوهش حاضر قصد دارد با ارائۀ الگوریتمی جدید مبتنی بر قالب‌های معنایی، سامانه‌ای قاعده‌مند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فارسی ارائه دهد. روش به کار گرفته‌شده در این پژوهش و الگوریتم پیشنهادی منحصربه‌فرد است. دادگان مورداستفاده در این پژوهش شامل 1000 جمله دادۀ آموزشی، 100 جمله دادۀ توسعه و 500 جمله دادۀ تست است که از منابع اینترنتی و شبکه‌های اجتماعی همچون یوتیوب جمع‌آوری گردیده است. جهت انجام کار، تمام حروف اضافه موردنظر پژوهش برچسب‌دهی معنایی شده و برای آن‌ها در پیکرۀ آموزشی، قالب‌های معنایی بر اساس زبان قالب بنیاد مینسکی (1975) تعریف شدند. همچنین برای کلمات قبل و بعد حروف اضافه در پیکره نیز قالب‌هایی تهیه‌ و در فایل داده مدخل‌ها وارد سامانه گردیدند. الگوریتم پژوهش در سه مسیر با استفاده از اطلاعات موجود در قالب‌ها، اقدام به تعیین معنای حروف اضافه در جملات ‌می‌کند. نتایج آزمایش‌های دادۀ تست، نشان‌ دهندۀ دقت بالای عملکرد سامانه (16/99%) در رفع ابهام معنایی از حروف اضافه در زبان فارسی است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA

Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet ...

متن کامل

رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی lda

ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده ...

متن کامل

بررسی معنایی و دسته بندی حروف اضافه زبان فارسی بر پایه نظریه لیبر

لیبر (2004 & 2009) نظریه ای تجزیه مدار با هفت مؤلفۀ معنایی و یک اصل به نام اصل هم نمایگی ارائه کرده است. در این نظریه هر عنصر زبانی یک اسکلت معنایی و یک بدنۀ معنایی دارد. اسکلت از یک یا چند مؤلّفه معنایی و یک یا چند موضوع ساخته می شود. بدنۀ معنایی دو لایه دارد: 1. لایه ای که مانند اسکلت از یک گویشور به گویشوری دیگر نسبتاً ثبات دارد و می توان آن را نشان داد؛ 2. لایه ای که اطلاعاتِ کلی و دانش فرهنگ ...

متن کامل

نقشهای معنایی حرف اضافة «از» در زبان فارسی

زبان به مانند موجودی زنده در طی زمان، دستخوش تغییر و تحوّلات می­گردد و بررسی ویژگی­های آن در صورت کنونی بدون در نظر گرفتن تغییرات درزمانی، پژوهشی ناقص و نارساست. در این مقاله، نقش­های معنایی حرف­ اضافة «از» در زبان­های اوستایی، فارسی باستان، فارسی میانه، پارتی، فارسی دری و فارسی امروز، با استفاده از داده­های دستور این زبان­ها و نیز واژه­نامه­های هر یک بررسی­شده‌است. «از» در زبان اوستایی و فارسی ...

متن کامل

کارکردهای معنایی و دستوریِ حرف اضافۀ «از» در زبان فارسی

با آنکه حروف‌اضافه به طبقۀ بسته‌ای از واژه‌ها تعلق دارند، اما چندمعنا بودنِ آنها سبب می‌شود تا کارکردهای معنایی و دستوریِ آنها متنوع باشد. این پژوهش با رویکردی پیکره‌بنیاد به بررسیِ توصیفیِ کارکردهای دستوری و معناییِ حرف اضافۀ «از» در زبان فارسی پرداخته‌است. برای این منظور، «پیکرۀ گزاره‌های معنایی زبان فارسی» مورداستفاده قرار گرفته است. در این پیکره که حجمی بالغ بر سی هزار جمله دارد و روابط محمول-مو...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 9  شماره 1

صفحات  99- 117

تاریخ انتشار 2018-06-22

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023