خوشه‌بندی فراابتکاری اسناد فارسی اِکس‌اِم‌اِل مبتنی بر شباهت ساختاری و محتوایی

نویسندگان

چکیده مقاله:

Due to the increasing number of documents, XML, effectively organize these documents in order to retrieve useful information from them is essential. A possible solution is performed on the clustering of XML documents in order to discover knowledge. Clustering XML documents is a key issue of how to measure the similarity between XML documents. Conventional clustering of text documents using a document similarity measure used in information content, they can cause structural information contained in XML documents is ignored. In this paper, a new model named matrix space model to represent both structural and content features of documents in XML, is proposed. Based on this model, the Jaccard similarity measure is defined and the colonial competitive algorithm for clustering XML documents is used. Experimental results show that the proposed model function in identifying similar documents which closely identified with the same structure and content information are effective. This method can improve the accuracy of clustering, and XML data can be used to increase productivity.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

خوشه بندی فراابتکاری اسناد فارسی اِکس اِم اِل مبتنی بر شباهت ساختاری و محتوایی

با توجه به رشد فزاینده ی تعداد اسناد xml، سازماندهی موثر این اسناد به منظور بازیابی اطلاعات مفید از آنها ضروری می باشد. یک راه حل امکان پذیر، انجام خوشه بندی بر روی اسناد xml به منظور کشف دانش است. مسئله کلیدی در خوشه بندی اسناد xml این است که چگونه می توان شباهت بین اسناد xml را اندازه گیری کرد. استفاده از روش های متداول خوشه بندی اسناد متنی که اطلاعات محتوایی را برای اندازه گیری شباهت سند بکا...

متن کامل

تشخیص رویدادهای غیرمعمول در ویدیو مبتنی بر شباهت ساختاری

این مقاله یک روش برای تشخیص رویدادهای غیرمعمول در ویدیو ارائه می دهد. ویدیو به یک مجموعه از تکه های مکعبی تقسیم شده است. یک توصیف کننده جدید برای بازنمایی این تکه ها پیشنهاد شده است. این توصیف کننده مبتنی بر شباهت ساختاری هر تکه با 9 همسایه هایش می باشد. همه تکه های نرمال آموزشی با استفاده از توصیفگر پیشنهاد شده در این مقاله باز نمائی و با استفاده از یک توزیع گوسین یه عنوان مدل مرجع مدل شده اند...

متن کامل

خوشه بندی اسناد متنی مبتنی بر مفاهیم همسایگی و شباهت معنایی

خوشه بندی، روش داده کاوی قدرتمندی است که جهت کشف موضوع از اسناد متنی مورد استفاده قرار می-گیرد. در این زمینه الگوریتم های خانواده k-means به دلیل سادگی و سرعت بالا، در خوشه بندی داده هایی با ابعاد بالا، کاربرد فراوانی دارند. در این الگوریتم ها، معیار شباهت cosine، تنها شباهت میان زوج اسناد را اندازه گیری می کند که در مواقعی که خوشه ها به خوبی تفکیک نشده باشند، عملکرد مناسبی ندارد. درمقابل، مفاه...

15 صفحه اول

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

سیر تطور دَهنامه و سی نامه سرایی در شعر فارسی با تکیه بر تحلیل ساختاری و محتوایی

دهنامه ها و سی نامه‌ها یک نوع ادبی و زیر مجموعه ای از منظومه های داستانی عاشقانه است که شاعر در آن، طیّ ده یا سی نامه عاشقانه با ساختاری ویژه، گفتگویی میان عاشق و معشوق را به رشته ی شعر می‌کشد. می‌توان شروع تقریبی دهنامه و سی نامه سرایی را از قرن پنج و دوره اصلی رواج آن را قرن هشت دانست. از آنجا که تاکنون پژوهش جامعی در این باره صورت نگرفته، در این مقاله به تحلیل محتوا و ساختار این گونه ی ادبی پ...

متن کامل

تحلیل محتوایی و ساختاری نفرین‌های نهج‌البلاغه

نفرین گونه‌ای از سخن و نوعی واکنش گفتاری است که بنا به دلایلی از سوی شخصی نسبت به شخص یا اشخاص دیگر ایراد می‌گردد. این شکل از سخن در بسیاری از متون ادبی و دینی جایگاهی ویژه به خود اختصاص داده است. نهج البلاغه ازجمله متونی است که در مواردی از آن این‌گونه ادبیات مورد استفاده قرار گرفته است. امیر بیان به پیروی از کلام خدای متعال و تحت تأثیر نزاهت قرآنی، در ایراد این گونه از کلام، جانب عفت را نگه د...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 13  شماره 2

صفحات  11- 23

تاریخ انتشار 2016-09

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023