بازیابی مستندات تایپی فارسی بر اساس جستجوی کلمه کلیدی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر
  • نویسنده سعیده رضایی
  • استاد راهنما سعید مظفری
  • سال انتشار 1393
چکیده

بر خلاف پیشرفت در مخابرات الکترونیکی، بسیاری از اسناد هنوز در شکل کاغذ فرستاده و دریافت می شوند که به دلیل اهمیت حقوقی آن ها باید آرشیو شوند. مدیریت حجم عظیم این اسناد، شرکت های بزرگ را نیازمند به اپراتورها و نیروهای انسانی کرده است تا این اسناد را چک و دسته بندی نمایند یا ممکن است لازم شود مکاتبه ها بر اساس محتوا دسته بندی شوند. هدف ما در این پایان نامه بازیابی مستندات تایپی فارسی بر اساس جستجوی کلمات کلیدی است. این نوع بازیابی که به عنوان "keyword spotting" از آن یاد می شود، مساله اصلی در کاربردهای کلاسه بندی/ بازیابی/ جستجو است، به همین دلیل در سال های اخیر توجه زیادی از دانشگاه و صنعت را به خود جلب کرده است. لازم به ذکر است برای اسناد در زبان هایی نظیر لاتین، چینی و ... این مساله حداقل در سطح تئوری حل شده است اما متاسفانه در زبان فارسی متاسفانه کار قابل ملاحظه ای انجام نشده است.

منابع مشابه

بازیابی مستندات قرآنی مسأله تفویض

مقاله حاضر با هدف بررسی مستندات قرآنی تفویض به معنای واگذاری امور به دیگران به رشته تحریر در آمده است. جهت یافتن مستندات قرآنی، افزون بر جست‌وجوی آیات از قرآن، از دیگر منابع حدیثی و کلامی هم استفاده شده است. یافته‌های تحقیق نشان می‌دهد که در آیات قرآن برخی امور به ملائکه نسبت داده شده است از جمله: میراندن و قبض روح، تدبیر نظام هستی، تقسیم امور، اعطای فرزند به حضرت مریم و همچنی...

متن کامل

بازیابی بر اساس محتوای اسناد چاپی فارسی

با افزایش کتابخانه های دیجیتال و برای برای دستیابی به هدف ادارات بدون کاغذ تعداد زیادی از کپی ها به دیجیتال تبدیل شده و در سیستم مدیریت اسناد ذخیره شده است. همچنین در حال حاضر میلیون ها سند دیجیتال دائماً بر روی اینترنت از یک نقطه به نقطه ی دیگر منتقل می شوند. اگر چه تکنولوژی پردازش تصویر اسناد می تواند برای تبدیل اتوماتیک تصاویر دیجیتال این اسناد به فرمت متن قابل خواندن به وسیله کامپیوتر با اس...

15 صفحه اول

نقد متنی روایات تفسیر نورالثقلین بر اساس مستندات قرآنی

بدون تردید روایات مسند و صحیح یکی از گنیجینه‌های ارزشمند در تبیین آیات و رمزگشایی از آنها و تأویل متشابهات است. دستیابی به روایاتی که هم به لحاظ سندی و هم به لحاظ متنی بتواند چنین نقشی را در فهم آیات قرآن کریم ایفا کند، همواره وجهة‌ همّت قرآن پژوهان به ویژه در تفاسیر اثری بوده است؛ امّا مشکل اساسی موجود در نوع تفاسیر اثری یعنی «حذف اسانید روایات» موجب گردیده که احراز نسبت روایات به معصوم دستخوش ت...

متن کامل

روش‌‌های تأکید کلمه در زبان فارسی

مبحث تأکید و روش‌‌های مؤکّد کردن اقسام کلمه از جمله مسائلی است که در دستورزبان، زبان‌‌شناسی و بلاغت مطرح است. در خلال کتاب‌‌هایی که در زمینۀ دستور زبان نوشته شده، معمولاً به‌‌ صورت گذرا اشاره‌‌هایی به روش‌‌های مؤکّد کردن اقسام کلمه شده است. گاهی نیز در مقالاتی که در این زمینه نوشته شده، به‌‌صورت موردی به روش‌‌های تأکید بر یک قسمِ کلمه پرداخته شده است. در این تحقیق کوشش بر این است که پاسخی به این پر...

متن کامل

بازیابی متون چاپی فارسی بر اساس پرس و جوی کلمات

در این پایان نامه روشی جدید برای بازیابی و جستجوی کلمات فارسی از میان متون تصویری فارسی ارائه شده است. همچنین روشی مبتنی بر اندازه و شکل نقاط موجود در مستند پس از آستانه گذاری، جهت تشخیص قلم و اندازه قلم مستندات تصویری فارسی ارائه شده است. روش ارائه شده برای تشخیص قلم از اولین روش هایی می باشد که می تواند با دقت بسیار بالایی اندازه قلم مستند فارسی را هم تشخیص دهد. برای ارزیابی روشهای ارائه شده ...

15 صفحه اول

امدادرسانی زمان‌مند بر اساس جستجوی فراکتال

پس از وقوع بحران، آمادگی برایامدادرسانی کارآمدنقشی اساسی در کاهش هزینه‌ها و تلفات انسانی احتمالی حادثه خواهد داشت. امدادرسانی به‌عنوان یکی از مهم‌ترین مراحل توسعه سامانه‌های مدیریت بحران شناخته می‌شود. به منظور توسعه رویکردی کارا برای امدادرسانی زمان‌مند، در این پژوهش به حل مسئله‌ای بر اساس مسئله مسیریابی موجودی با وضعیت چند دوره‌ای و چند کالایی پرداخته شده است. جهت حل مدل، از یک الگوریتم بهبود...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023