ارائه الگوریتمی کارآمد برای استخراج روابط معنایی در مستندات، مبتنی بر پایگاه دانش ویکی پدیا

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده مهندسی برق و کامپیوتر
  • نویسنده امین مصلی نژاد
  • استاد راهنما علی احمدی
  • سال انتشار 1393
چکیده

در این پژوهش، هدف بررسی روش های موجود برای استخراج روابط معنایی میان عبارات است که در زمینه های مختلف پردازش متن همچون اصلاح غلط های املایی، خلاصه سازی متن، ابهام زدایی لغات، حل مشکل چند منبعی، بازیابی اطلاعات، استخراج الگوهای اطلاعات، تشخیص موضوع، استخراج خودکار کلمات کلیدی، شاخص گذاری موضوع، خوشه بندی متون و دیگر حوزه های مرتبط حائز اهمیت می باشد؛ لذا مفاهیم موجود در این زمینه به دقت مورد بررسی قرارگرفته و روش های موجود در قالبی مشخص و تفکیک شده، شرح داده شده است و درباره نقاط قوت و ضعف هر یک از روش ها بحث صورت گرفته است. در روشی جدید با استفاده از پایگاه دانش ویکی پدیا برای هر عبارت یک فضای مفهوم ایجاد شده است. این فضای مفهوم با وزن دهی قسمت های مختلف موجود در سایت ویکی پدیا ساخته شده که ازاین رو، فضای مفهوم وزن دار نام گذاری شده است. فضای مفهوم وزن دار با یک ماتریس عبارت_مفهوم نمایش داده می شود که ستون های آن نمایانگر مفاهیم، سطرهای آن نمایانگر عبارات و هر یک از خانه های این ماتریس، میزان ارتباط معنایی یک عبارت به یک مفهوم را نشان می دهد. با استفاده از فضای مفهوم وزن دار ارتباط معنایی بین دو عبارت محاسبه شده، همچنین از این فضای مفهوم برای محاسبه ارتباط معنایی بین دو متن نیز بهره گرفته شده است. برای محاسبه ارتباط های معنایی از نگاشت یک عبارت یا متن به فضای مفهوم استفاده می شود. با این نگاشت هر عبارت یا متن با یک بردار نمایش داده می شود که به این بردار، فضای مفهوم آن عبارت یا متن گفته می شود. در حقیقت تمام مقایسات برای محاسبه ارتباط معنایی میان عبارت ها یا متن ها در فضای بردار با استفاده از بردار مفهوم صورت می پذیرد. لذا ساخت فضای مفهوم وزن دار و محاسبه ارتباط معنایی میان عبارت ها و متن ها هدف اصلی این پژوهش می باشد. همچنین برای نمایش کارایی این الگوریتم دو پایگاه داده ارتباط معنایی میان عبارات در زبان فارسی ایجاد شده است. یکی از آن ها توسط عامل های انسانی تهیه شده که از این رو به آن پایگاه داده انسانی گفته شده و پایگاه داده دیگر به صورت خودکار ایجاد شده که به آن پایگاه داده خودکار گفته شده است. با استفاده از این دو پایگاه داده نشان داده شده که روش پیشنهادی کارایی مناسبی در استخراج روابط معنایی دارد.

منابع مشابه

ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متن‌کاوی در حوزه یادگیری الکترونیکی

As computer networks become the backbones of science and economy, enormous quantities documents become available. So, for extracting useful information from textual data, text mining techniques have been used. Text Mining has become an important research area that discoveries unknown information, facts or new hypotheses by automatically extracting information from different written documents. T...

متن کامل

ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متن کاوی در حوزه یادگیری الکترونیکی

هنگامی که شبکه های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش های متن کاوی استفاده می شود. متن کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به وسیله استخراج اطلاعات از اسناد مختلف است. همچنین متن کاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد ز...

متن کامل

ارائه مدل هدایت تحصیلی کارآمد دانش آموزان؛ مبتنی بر فن آوری اطلاعات و ارتباطات

هدف پژوهش حاضر ارائه مدل هدایت تحصیلی کارآمد دانش‌آموزان مبتنی بر فناوری اطلاعات و ارتباطات بود. رویکرد پژوهش آمیخته و با طرح اکتشافی بود. در بخش کیفی از روش داده بنیاد و در بخش کمّی از روش توصیفی نوع پیمایشی استفاده شد. جامعه آماری در بخش کیفی، شامل صاحب‌نظران نظام هدایت تحصیلی در استان گلستان و در بخش کمّی مشاوران، مدیران مدارس و معاونان آموزشی شهرهای گرگان و آق‌قلا به تعداد 650 نفر در سال تحصی...

متن کامل

استخراج دانش از پایگاه داده نرم افزارهای مدیریت اطلاعات و مستندات با تکنیک های داده کاوی

حجم بزرگ داده ها به تنهایی به مدیران سازمان ها در تصمیم سازی و تصمیم گیری هیچ کمکی نمی کند، بلکه باعث سر در گمی مدیران سازمانها نیز می-شود. بنابراین مدیریّت داده های خام و تبدیل داده های خارجی و داخلی سازمان به اطّلاعات و دانش با استفاده از تکنیک های گوناگون، نقش اساسی و محوری دارد. از تکنیک های معروف در این زمینه داده کاوی است، که می تواند بر روی بانک اطّلاعاتی انجام شود و دانش مورد نیاز را به دس...

متن کامل

الگوریتمی برای فشرده‌سازی خطوط سیر مکانی با حفظ ماهیت معنایی

یک راه معمول برای ذخیره اطلاعات مکانی-زمانی اشیاء در حال حرکت، نمایش مسیر حرکت شئ متحرک به شکل خط سیر سه‌بعدی (موقعیت جغرافیایی نقاط به همراه زمان) است. در سال‌های اخیر تحقیقات گسترده‌ای در حوزه خط سیر انجام شده است. با این حال، در این مطالعات، ایده خط سیر معنایی یک مفهوم نسبتاً جدید است که با هدف انجام آنالیزهای معنایی مؤثر روی داده‌ها انجام می‌شود. در خط سیر معنایی که یک نمایش ثانویه از خط سیر...

متن کامل

ارائه مدلی برای دستیابی به هدایت تحصیلی کارآمد دانش آموزان در نظام آموزشی ایران

هدف این پژوهش ارائه مدلی برای دستیابی به هدایت تحصیلی کارآمد دانش آموزان در نظام آموزشی ایران است. رویکرد پژوهش آمیخته و با طرح اکتشافی بود. در بخش کیفی از روش نظریه برخاسته از داده و در بخش کمّی از روش توصیفی از نوع پیمایشی استفاده شد. روش نمونه گیری در بخش کیفی هدفمند و در بخش کمّی تصادفی طبقه ای بود. نمونه آماری در بخش کیفی با در نظر گرفتن قانون اشباع نظری، تعداد 17 نفر و در بخش کمّی، بر اساس ف...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده مهندسی برق و کامپیوتر

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023