پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1396
پدیدآورندگان:
زهره فریدون مقدم [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]، وحید ابوالقاسمی[استاد مشاور]
چکیده: امروزه در کاربردهای مختلف همچون سامانه‌های‌ کنترل ترافیک، سنسورهای هواشناسی، سیستم‌های پزشکی، شبکه‌های اجتماعی و غیره، با سرعت بسیار زیادی داده تولید می شود. به این داده ها، جریان داده اطلاق شده و تحلیل آنها نوعا نیازمند روش‌های تکاملی و افزایشی می‌باشد. خوشه بندی یکی از روش های متداول تحلیل و یادگیری است و الگوریتم های متعددی در این حوزه ارائه شده است. خوشه‌بندی جریان داده‌ها به دلایل مختلفی هم‌چون عدم دسترسی همزمان به تمامی داده، تغییرات خوشه‌ها، و غیره، روش‌هایی متفاوت از خوشه‌بندی سنتی را طلب می‌کند. در این پایان نامه الگوریتم خوشه بندی مبتنی بر مدل ارائه خواهد شد که با استفاده از تئوری احتمال شرطی و براساس اطلاعات پیشین، خوشه بندی احتمالاتی را انجام می دهد. الگوریتم پیشنهادی با داده های مصنوعی و داده های واقعی آزمایش می شود و در ادامه با روش های FCM و Gustafson-Kessel مقایسه خواهد شد. براساس نتایج حاصل از مقایسه، این الگوریتم دقت خوشه بندی را نسبت به الگوریتم های ذکر شده، بهبود می دهد و همچنین مقاومت بیشتری در مقابل نویز دارد. با توجه به ماهیت افزایشی جریان داده، الگوریتم پیشنهادی برای این نوع داده ها توسعه داده شده و بعد از پیا‌ده‌سازی با استفاده از چارچوب محاسباتی خوشه ای Spark، ارزیابی می‌شود. با پیاده سازی موازی الگوریتم، زمان اجرا کاهش می یابد. آزمایشات نشان می دهندکه الگوریتم پیشنهادی مقایس پذیری لازم برای کار با حجم بالای داده را دارد.
کلید واژه ها (نمایه ها):
#خوشه بندی #خوشه بندی احتمالاتی #جریان داده #خوشه بندی جریان داده #محاسبات خوشه-ای

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)