نگین دانش‌پور

دانشگاه تربیت دبیر شهید رجایی - دانشکده مهندسی کامپیوتر

[ 1 ] - مدلی سه‌لایه‌ای در طراحی سطح منطقی پایگاه داده تحلیلی

پایگاه‌های داده عملیاتی و سیستم‌های پردازش تراکنشی برخط ساختارهای مناسبی برای نگهداری و جمع‌آوری اطلاعات هستند، اما چالش این ساختارها چگونگی استفاده و تفسیر این اطلاعات است. یک پایگاه داده تحلیلی، منبع داده‌ای است که داده‌ها را از سیستم‌ها و منابع اطلاعاتی دیگر مانند پایگاه داده‌های عملیاتی، سیستم کاربران و ... جمع‌آوری می‌کند و پس از همگن و یکپارچه‌سازی، به‌صورت چندبعدی دسته‌بندی و ذخیره می‌کن...

[ 2 ] - انتخاب دید جهت ذخیره‌سازی دید در پایگاه داده تحلیلی با استفاده از الگوریتم فرهنگی ترکیبی

پایگاه داده تحلیلی حجم زیادی از داده‌ها که در سیستم‌های تصمیم‌گیرنده و گزارش‌گیر مورد استفاده قرار می‌گیرد را ذخیره می‌کند. در این سیستم‌ها سرعت پاسخ‌گویی به پرس‌وجوها به علت حجم زیاد داده‌های ذخیره‌شده، پایین است. از آن‌جایی که این سیستم‌ها عموماً مورد استفاده مدیران ارشد در سازمان‌های مختلف هستند، درنتیجه افزایش سرعت در این سیستم‌ها حائز اهمیت است. یکی از روش‌های افزایش سرعت، ذخیره دیدها جهت پ...

[ 3 ] - بهبود عبارت نگهداری دید در پایگاه داده تحلیلی

در پایگاه داده تحلیلی برای پاسخگویی سریع به پرس و جوهای تحلیلی کاربران، پاسخ تعدادی از پرس و جوها را ذخیره می نمایند. پاسخ پرس و جوهایی که در پایگاه داده تحلیلی ذخیره می شوند، منجر به تولید دیدهای ذخیره شده می گردد. مساله بروز رسانی و نگهداری از دیدها در پایگاه داده تحلیلی زمانی مطرح می گردد که داده ها در منابع داده پایه بوسیله تراکنش های مختلف مورد تغییر قرار گیرند. برای نگهداری از دیدها در پا...

[ 4 ] - مدل بهبودیافته دولایه ای در طراحی سطح منطقی پایگاه داده تحلیلی

پایگاه داده تحلیلی، مخزن داده ای متمرکز، جمع آوری شده از منابع اطلاعاتی مختلف و ناهمگن در یک محدوده وسیع زمانی و برای پشتیبانی از سیستم های تصمیم یار می باشد. پایگاه داده تحلیلی منبع داده ای است که در فرایند تصمیم گیری از طریق پردازش تحلیلی بر خط استفاده می شود. فرایند توسعه یک پایگاه داده تحلیلی با تحلیل پایگاه داده عملیاتی، شناسایی نیازهای تحلیلی و نهایتا طراحی در سه سطح مفهومی، منطقی و فیزیک...

[ 5 ] - اعمال مدل‌های رگرسیون بر زیرمجموعه‌های با همبستگی بالا برای بهبود جایگذاری مقادیر جاافتاده عددی

حضور مقادیر جاافتاده در داده‌های دنیای واقعی مشکلی بسیار رایج و غیرقابل‌اجتناب است. بنابراین لازم است تا پیش از عملیات اکتشاف دانش، این مقادیر جاافتاده به‌طور دقیق پُر شوند. در این مقاله، سه رویکرد جدید برای تخمین مقادیر جاافتاده عددی پیشنهاد می‌شود. در تمامی روش‌های پیشنهادی، مدل‌های رگرسیون بر زیرمجموعه‌هایی با همبستگی بالا اعمال می‌شوند. در انتخاب زیرمجموعه‌های مطلوب سعی می‌شود تا همبستگی بین...

[ 6 ] - تصحیح خودکار داده‌ها مبتنی بر وابستگی تابعی و سیستم یادگیری مرکب

صحت داده‌ها یکی از مهم‌ترین ابعاد کیفیت داده‌ها به‌شمارمی‌رود. با توجه به حجم بالای منابع داده‌ای نیاز به روش‌هایی خودکار وجود دارد. در این مقاله راهکاری خودکار برای تصحیح داده‌هایی با انواع داده‌ای متفاوت ارائه ‌شده ‌است. در این راهکار در ابتدا رکوردهایی که احتمالاً حاوی ویژگی خطا است با استفاده از وابستگی تابعی شناسایی‌می‌گردد، بدین‌صورت که رکوردی که به ازای یک وابستگی تابعی با بیش از  از رکور...

[ 7 ] - انتخاب اعضای ترکیب در خوشه‌بندی ترکیبی با استفاده از رأی‌گیری

Clustering is the process of division of a dataset into subsets that are called clusters, so that objects within a cluster are similar to each other and different from objects of the other clusters. So far, a lot of algorithms in different approaches have been created for the clustering. An effective choice (can combine) two or more of these algorithms for solving the clustering problem. Ensemb...

[ 8 ] - A New Method for Duplicate Detection Using Hierarchical Clustering of Records

Accuracy and validity of data are prerequisites of appropriate operations of any software system. Always there is possibility of occurring errors in data due to human and system faults. One of these errors is existence of duplicate records in data sources. Duplicate records refer to the same real world entity. There must be one of them in a data source, but for some reasons like aggregation of ...

[ 9 ] - Missing data imputation in multivariable time series data

Multivariate time series data are found in a variety of fields such as bioinformatics, biology, genetics, astronomy, geography and finance. Many time series datasets contain missing data. Multivariate time series missing data imputation is a challenging topic and needs to be carefully considered before learning or predicting time series. Frequent researches have been done on the use of diffe...