استخراج اطلاعات از ویکی پدیا و گسترش شبکه واژگانی فارسی با نمونه ها جهت استفاده در یک سامانه پرسش و پاسخ به زبان فارسی

پایان نامه
چکیده

هدف تحقیق صورت گرفته، ارائه یک بستر اطلاعاتی است که بتواند در یک سامانه پرسش و پاسخ به زبان فارسی مورد استفاده قرار گیرد و پرسش های با انواع تعریف شده را بتواند پاسخ دهد. دامنه اطلاعات استخراج شده و در نتیجه پرسش های قابل پاسخگویی از نظر موضوع محدود نبوده و به عبارتی عام می باشد. یک دسته پرکاربرد از سامانه های پرسش و پاسخ، دسته ای هستند که روی پرسش از حقایق متمرکزند. پرسش و پاسخ در این سامانه ها روی مواردی چون افراد، مکان ها، وقایع و ... صورت می گیرد که با نام نمونه ها معروف اند. نمونه ها موجودیت هایی متعلق به یک کلاس پدر می باشند که در صورتی که با دیدگاه هستان شناسانه به آنها بنگریم در سلسله مراتب هستان شناسی در برگ قرار می گیرند و فرزندی نخواهند داشت. یک منبع مناسب در پاسخگویی به پرسش های عمومی دانشنامه ها هستند از ویکی پدیا به عنوان یک دانشنامه آزاد و حاوی مقالات در موضوعات مختلف استفاده شده است. منبع دیگر قابل استفاده در پرسش و پاسخ، هستان شناسی های عمومی هستند که شبکه واژگانی فارسی (فارس نت) به عنوان نمونه ای از این دسته مورد استفاده قرار گرفته است. فارس نت حاوی واژگان عمومی فارسی در قالب دسته های هم معنا می باشد که بین این دسته ها روابط مختلف و از جمله روابط سلسله مراتبی وجود دارد. تعداد نمونه های موجود در فارس نت محدود می باشد و از این رو به تنهایی در پرسش و پاسخ کافی نمی باشد و لازم است با نمونه ها گسترش یابد. از این رو بستر اطلاعاتی به منظور استفاده در سامانه پرسش و پاسخ تهیه می شود که متشکل از فارس نت توسعه یافته با نمونه-ها می باشد. بدین ترتیب که با استفاده از مقالات ویکی پدیای فارسی که حاوی نمونه های بسیاری از کلاس های موجود در فارس نت می باشد، نمونه ها و اطلاعات آنها استخراج شده و به کلاس پدر خود در فارس نت متصل می شود. همچنین برای نمونه های اضافه شده اطلاعاتی چون زوج های صفت-ارزش، یک جمله توضیحی و مفاهیم مرتبط با آن در فارس نت استخراج می شود. روی بستر اطلاعات فراهم شده یک مولفه پرسش و پاسخ با قابلیت پاسخ به سه نوع مشخص از پرسش ها قرار می گیرد. این انواع، پرسش از چیستی، پرسش از نمونه ها و پرسش از ارزش های صفات می باشند. از قابلیت های بستر اطلاعاتی فراهم شده این است که به دلیل اینکه نمونه های استخراج شده به یک شبکه واژگانی متصل شده اند، می توان از ویژگی های شبکه واژگانی در فهم پرسش و همچنین ارائه پاسخ استفاده کرد و بدین ترتیب به پرسش های پیچیده ای که نیاز به نوعی استنتاج دارند پرداخت.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارایه یک پیکره‌ پرسش و پاسخ مذهبی در زبان فارسی

Question answering system is a field in natural language processing and information retrieval noticed by researchers in these decades. Due to a growing interest in this field of research, the need to have appropriate data sources is perceived. Most researches about developing question answering corpus area have been done in English so far, but in other languages as Persian, the lack of these co...

متن کامل

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

تاثیرپذیری زبان وادب بلوچی از زبان و ادبیات فارسی و ارتباط واژگانی آن ها

زبان بلوچی یکی از زبان های ایرانی است که قدمتی دیرینه دارد. زبان و ادب فارسی از قرن ها پیش بر زبان و ادب بلوچی، تأثیر فراوانی گذاشته است. مردم بلوچ، فارسی را زبانی مقدس میدانستهاند و این زبان چندین قرن، مستقیم و نیرمستقیم بر ادب و اجتماع بلوچستان تأثیرگذار بوده است. این تأثیر و جایگاه سبب شده است که ارتباط واژگانی بلوچی با فارسی ارتباتی تنگاتنگ باشد. البته به دلیل همسایگی بلوچان با سرزمین خراسا...

متن کامل

بازتحلیل واژگانی، جلوه‌ای از فارسی سازی وام‌ واژه‌ها در زبان فارسی؛ یک بررسی ساختاری

بازتحلیل واژگانی، یکی از جلوه‌های بومی‌سازی است که در اثر ناآگاهی افراد از ریشة واژه، رخ می‌دهد. در بازتحلیل واژگانی، جزئی از وام‌واژه بر اساس شباهت ظاهری، با یک تکواژ یا واژه مشابه، اشتباه گرفته می‌شود و با آن جایگزین می‌شود. پدیده بومی‌سازی در هر زبانی با توجه به قواعد خاصِ آن زبان، شکل ویژه‌ای به خود می‌گیرد و در پی آن نامی مرتبط با اسم همان زبان، بر آن گذارده می‌شود. بنابراین دراین مقاله، بو...

متن کامل

تحلیل واژگانی افعال زبان فارسی

دستور زبان نویسان و پژوهشگران زبان و ادب فارسی تمام افعال این زبان را بی قاعده فرض نموده ومعتقدند که هر فعل در زبان فارسی دو ریشه یا ماده دارد : ریشه گذشته و ریشه حال .صیغه هایی که برگذشته دلالت دارند ‘از ریشه گذشته و صیغه هایی که بر حال و آینده دلالت دارند ‘از ریشه حال مشتق می شوند . مقاله حاضر‘کوششی است برای اثبات این امر که تعداد قابل توجهی از افعال زبان فارسی ‘ همانند افعال زبان انگلیسی با...

متن کامل

زبان فارسی و گسترش اسلام در چین

زبان فارسی برای مدتی طولانی زبان فرهنگی و عبادی مسلمانان چین بود. نشانه­های تاریخی از قبیل کتیبه­ها و سنگ­ نوشته­های فارسی، تعداد قابل توجه نسخه­های خطی فارسی و اسناد غنی کتاب‌های چینی و همچنین ادامه رواج زبان فارسی در اصطلاحات روزمره در میان مسلمانان چین و بعضی واژه­های دیگر فارسی که از قدیم وارد زبان چینی شده، جملگی نشان می­دهد که فارسی در تاریخ چین دورانی پر رونق داشته است. در اینجا این سوال...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023