کاوش برخط الگوهای پویای زمانی در داده های جریانی

پایان نامه
چکیده

کاوش در جریان داده فرایندی است که منجر به استخراج دانش از جریانی سریع از داده های پیوسته می شود. در سالهای اخیر، به دلیل اهمیت کاربردهای آن و پیشرفت در تکنولوژی سخت افزاری بسیار مورد توجه قرار گرفته شده است. در بسیاری از زمینه های کاربردی مانند شبکه های کامپیوتری، بازارهای مالی و مبادلات ارزی، مکالمات تلفنی، کارت های اعتباری، مراکز داده و سرورها، تصاویر ویدئویی، شبکه حسگرها، رادارها، ماهواره ها و ...، حجم جریان های داده به قدری زیاد است که ذخیره آن تقریبا غیر ممکن است. بعلاوه، حتی اگر ذخیره داده ها ممکن باشد، نرخ داده های ورودی بقدری زیاد است که انجام عملیات بیش از یک بار بر روی هر داده امکان پذیر نمی باشد. از طرفی در بسیاری از موارد توزیع داده ها متأثر از عوامل بیرونی، پیوسته با زمان تغییر میکند. در نتیجه طراحی الگوریتم های برخط و کارا به منظور کاوش در ساختار متغیر جریان های داده ضرورت می یابد. روش های غیر خطی بر پایه آنالیز مولفه های اصلی کرنلی (kpca) در داده کاوی به منظور استخراج ساختار های غیر خطی از داده ها بسیار مورد استفاده قرار گرفته شده و کارایی بالایی نسبت به روش های خطی از خود نشان داده اند. اما پیاده سازی این روش ها که بر پایه تجزیه مقدار تکین کرنلی (ksvd) دسته ای ماتریس داده ها است، مناسب کاربرد هایی که نیازمند پردازش برخط می باشند، نمی باشد. در این پایان نامه ما sksvd را که یک الگوریتم جدید به روز رسانی ksvd می باشد را به منظور یافتن کارای الگوهای غیر خطی از داده های جریانی ارائه کرده ایم. الگوریتم ارائه شده به کمک ایده توابع کرنل ، یک انتقال متعامد خطی را از داده های اخیر در فضایی با ابعاد بسیار بالاتر ( شاید بی نهایت) که به آن فضای ویژگی یا فضای کرنل می گویند، یاد می گیرد و هرگاه داده ی جدیدی تولید شود این الگوریتم آن را به صورت غیر خطی به آن فضا نگاشت کرده و بعد از استخراج الگوهای آن، انتقال متعامد را به صورت افزایشی و با کمترین میزان مصرف منابع به روز می کند. از آنجا که فضای اولیه و فضای ویژگی به صورت غیر خطی به هم وابسته هستند، الگوهای بدست آمده غیر خطی خواهند بود. الگوهای بدست آمده را سپس می توان به منظور کشف تغییر در مفهوم و توزیع داده ها و یا شناسایی ناهنجاری مورد استفاده قرار داد. نتایج حاصل از آزمایش هایی گوناگون بر روی داده های واقعی و ساختگی تاثیر گذاری و کارایی روش ما را نشان میدهد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

کاوش الگوهای تکرار شونده در جریانهای داده

یافتن دسته داده های تکراری در جریان پیوسته تراکنشها یکی از مسائل حیاتی در کاربردهایی نظیر تحلیل سبد خرید، مانیتورینگ شبکه و پیش‎بینی فروش انبار می باشد. پنجره لغزان یکی از مدلهایی است که به دلیل مدیریت تغییر محتوا، مصرف حافظه محدود و سرعت پردازش کم به شکل گسترده در یافتن دسته داده های تکراری در جریانهای داده استفاده شده است. یک الگوریتم مبتنی بر مدل پنجره ای لغزان به یک ساختمان داده کارا احتیاج...

15 صفحه اول

کاوش الگوهای تکراری پرسود در پایگاه داده های بزرگ

داده­کاوی مجموعه اقلام پرسود در پایگاه داده تراکنشی، منجر به شناسایی مجموعه اقلام با بالاترین سودمندی می­شود. گرچه در سال های اخیر الگوریتم­های بسیاری برای این نمونه کار پیشنهاد شده است، اما این الگوریتم­ها، اکثراً، کارائی خود را صرف تولید مجموعه اقلام کاندید برای تولید مجموعه اقلام پرسود می­نمایند. چنانچه پایگاه داده دارای تعداد تراکنش­های بسیار زیاد و یا دارای مجموعه اقلام پرسود خیلی طولانی با...

طبقه بندی برخط داده های جریانی غیرایستان و نامتعادل با رویکرد وزن دهی

طبقه بندی داده های جریانی غیرایستان یکی از شاخه های مهم علم تشخیص الگو و یادگیری ماشین است که به طور روز افزون مورد توجه قرار گرفته است. دلیل این موضوع کاربردهای فراوان جدیدی از قبیل کارت های اعتباری، آب و هوا، شبکه های حس گر بی سیم، داده های وب و غیره است. در طبقه بندی داده های جریانی چالش اساسی تغییر مفهوم (غیرایستان بودن) است، که در آن تابع توزیع زیرین توصیف کننده داده ها به مرور زمان تغییر ...

کاوش الگوهای پویایی مشتریان در صنعت بانکداری

برای چندین دهه، سازمان‌ها بیش از مشتریان بر نشان تجاری و محصولاتشان تمرکز می‌کردند؛ اما اکنون بنگاه‌های اقتصادی بر ایجاد و حفظ ارتباط مؤثر با مشتریان متمرکز شده‌اند. در چنین شرایطی شناخت مشتریان و نیازهای آنان به امری حیاتی برای سازمان‌ها تبدیل شده است. یکی از پرکاربردترین روش‌های شناخت مشتریان، بخش‌بندی آنها به گروه‌های متجانس و شناخت ویژگی‌های هر بخش است؛ اما شیوه‌های سنتی و ایستای بخش‌بندی م...

متن کامل

کاوش k زیرگراف با بیشترین تکرار از گراف های جریانی

امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد. از سوی دیگر، امروزه نیز استفاده ی همگانی از وب و اینترنت ما را با حجم زیادی از داده و اطلاعات مواجه می کند. با این رشد انفجاری در داده های ذخیره شده، نیاز به روشهایی است که اصطلاحا به کشف دانش ...

کاوش الگوهای تکراری در جریان های داده بر اساس مدل پنجره لغزنده

در مسئله کاوش الگوهای تکراری به دنبال مجموعه هایی هستیم که در تعداد قابل توجهی از تراکنش ها (رکوردها) دیده می شوند. کاوش الگوهای تکراری در جریان های داده کاربرد زیادی در صنعت، تجارت و علوم مختلف دارد. به دلیل سرعت زیاد، بی پایان بودن، حجم بالا و ماهیت تغییر کننده محتوای جریان های داده، یافتن الگوهای تکراری در این نوع داده ها مسئله ای چالش برانگیز است. مدل پنجره لغزنده یکی از مدل های محبوب و پرک...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023