پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1396
پدیدآورندگان:
زهره فریدون مقدم [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]، وحید ابوالقاسمی[استاد مشاور]
چکیده: امروزه در کاربردهای مختلف همچون سامانههای کنترل ترافیک، سنسورهای هواشناسی، سیستمهای پزشکی، شبکههای اجتماعی و غیره، با سرعت بسیار زیادی داده تولید می شود. به این داده ها، جریان داده اطلاق شده و تحلیل آنها نوعا نیازمند روشهای تکاملی و افزایشی میباشد. خوشه بندی یکی از روش های متداول تحلیل و یادگیری است و الگوریتم های متعددی در این حوزه ارائه شده است. خوشهبندی جریان دادهها به دلایل مختلفی همچون عدم دسترسی همزمان به تمامی داده، تغییرات خوشهها، و غیره، روشهایی متفاوت از خوشهبندی سنتی را طلب میکند.
در این پایان نامه الگوریتم خوشه بندی مبتنی بر مدل ارائه خواهد شد که با استفاده از تئوری احتمال شرطی و براساس اطلاعات پیشین، خوشه بندی احتمالاتی را انجام می دهد. الگوریتم پیشنهادی با داده های مصنوعی و داده های واقعی آزمایش می شود و در ادامه با روش های FCM و Gustafson-Kessel مقایسه خواهد شد. براساس نتایج حاصل از مقایسه، این الگوریتم دقت خوشه بندی را نسبت به الگوریتم های ذکر شده، بهبود می دهد و همچنین مقاومت بیشتری در مقابل نویز دارد.
با توجه به ماهیت افزایشی جریان داده، الگوریتم پیشنهادی برای این نوع داده ها توسعه داده شده و بعد از پیادهسازی با استفاده از چارچوب محاسباتی خوشه ای Spark، ارزیابی میشود. با پیاده سازی موازی الگوریتم، زمان اجرا کاهش می یابد. آزمایشات نشان می دهندکه الگوریتم پیشنهادی مقایس پذیری لازم برای کار با حجم بالای داده را دارد.
کلید واژه ها (نمایه ها):
#خوشه بندی #خوشه بندی احتمالاتی #جریان داده #خوشه بندی جریان داده #محاسبات خوشه-ای دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: