پایانامه های دانشگاه صنعتی شاهرود

Q143: تحلیل روابط گروهی در جریان‎داده با استفاده از خوشهبندی

پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1397

پدیدآورندگان:

میلاد محمدی پارچینی [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]، منصور فاتح[استاد مشاور]

چکیده: امروزه با توجه به افزایش روند تولید داده‎ها و ظهور مفهوم جریان‌داده‎، می‎توان اطلاعات مفیدی را به کمک روش‎های داده‌کاوی از داده‎ها استخراج کرد. این اطلاعات می‎توانند در زمینه‎های متنوعی مانند تحلیل شبکه‎های اجتماعی، گروه‎بندی اطلاعات پزشکی بیماران و تشخیص نفوذ در شبکه استفاده شوند. از میان راهکارهای استخراج اطلاعات، می‎توان به خوشه‎بندی که روشی مناسب برای سازمان‎دهی داده‎ها است، اشاره داشت. در این پایان‎نامه، روشی جدید بر پایه‎ی راهکار خوشه‎بندی تطبیقی معرفی شده است. خوشه‎بندی تطبیقی با در نظر گرفتن یک دانش زمینه‎ای، سعی در ایجاد خوشه‎هایی با قدرت تفسیرپذیر‎ی بالاتر را دارد، تا بتواند به کشف روابط گروهی احتمالی موجود در میان داده‎ها و به دست آوردن اطلاعات مفید بیشتری از خوشه‎ها بپردازد. به طور کلی اگر داده‎ها از قبل گروه‎بندی مشخصی داشته باشند و بخواهیم از این پیش‎زمینه در فرایند خوشه‎بندی بهره ببریم، به نحوی که رابطه‎ای بین خوشه‎ها و گروه‎های پیشین وجود داشته باشد، می‎توان از خوشه‎بندی تطبیقی استفاده کرد. خوشه‎بندی تطبیقی، با وجود رویکرد تازه‎ای که به مقوله‎ی خوشه‎بندی داشته است، قابل اجرا بر روی جریان‎داده‎ها نیست و به صورت متمرکز عمل می‎کند. در روش پیشنهادی این پایان‎نامه، فرایند خوشه‎بندی تطبیقی به صورت برخط و افزایشی ارائه شده است تا بتوان مفهوم موجود در خوشه‎بندی تطبیقی را بر روی جریان‎داده‎ها به کار گرفت و به کشف روابط گروهی بر روی آن‎ها پرداخت. روش پیشنهادی، با بهره‎گیری از دانش‎زمینه‎ای نگاه تازه‌ای در مفهوم خوشه‎بندی ایجاد کرده است. راهکار ارائه شده در این تحقیق تاکنون جزء نخستین روش‎های برخط خوشه‎بندی تطبیقی به حساب می‎آید. از مزایای مهم روش پیشنهادی می‎توان به امکان یافتن روابط گروهی موجود در یک جریان‎داده، کاهش حافظه‎ی مورد نیاز برای ذخیره‎سازی داده‎ها با بهره‎گیری از خلاصه‎سازی نمونه‎های جریان‎داده، کاهش پیچیدگی زمانی و محاسباتی و همچنین عدم وابستگی به تعداد خوشه‎ها به منظور ایجاد خوشه‎های نهایی اشاره کرد. نتایج به دست آمده از انجام آزمایش‎ها روی مجموعه‎داده‎های مصنوعی و واقعی، عملکرد مناسب روش پیشنهادی را در مقایسه با خوشه‎بندی تطبیقی پایه و خوشه‎بندی K-Means تایید می‎کند.

کلید واژه ها (نمایه ها):

#جریان‎داده‎ #خوشه‎بندی #خوشه‎بندی تطبیقی #یادگیری افزایشی #دانش‎زمینه‎ای

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:

دانشگاه صنعتی شاهرود
Shahrood University of
Technology

دسترسی سریع

وبگاه‌ها