پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > علوم ریاضی > مقطع کارشناسی ارشد > سال 1396
پدیدآورندگان:
زینت سلیمی ثانی [پدیدآور اصلی]، داود شاهسونی[استاد راهنما]
چکیده: خوشه‌بندی یکی از مسائل مهم داده‌کاوی در کشف الگو‌های پنهان در داده‌ها است.‌ هنگامی که تعداد متغیرها بسیار زیاد باشد و با داده‌های با بعد بالا مواجه باشیم، مسئله کاهش بعد نیز در کنار خوشه‌بندی، مطرح می‌شود.‌ یکی از متداول‌ترین روش‌های کاهش بعد که در هر دو موضوع یادگیری با نظارت و بدون نظارت استفاده می‌شود، تحلیل مولفه‌های اصلی است که دارای محاسن و معایب خاص خود می‌باشد.‌ در این پایان‌نامه علاقه‌مندیم تا با معرفی روش خوشه‌بندی ممیزی بهینه (ODC) و به منظور کاهش بعد، مساله خوشه‌بندی که یک مساله یادگیری بدون نظارت است را در قالب مساله رگرسیون ریج، بیان کنیم تا بتوان همانند اندیشه‌ی مولفه‌های اصلی، نوع دیگری از ترکیب خطی متغیرهای اولیه را برای ساختن متغیرهای جدید استخراج نموده و سپس یکی از الگوریتم‌های خوشه‌بندی نظیر k-میانگین را برای مشاهدات تبدیل یافته‌ی جدید بکار گیریم.‌ در این مساله، یک پارامتر تنظیم نقش بسزایی در عملکرد خوشه‌بندی خواهد داشت.‌ همچنین وجود برخی از متغیر‌های غیر ضروری در مدل، موجب عملکرد منفی و ضعیف روش خوشه‌بندی می‌شود.‌ با اضافه کردن تابع جریمه لاسو گروهی، این ضعف را برطرف می‌کنیم و خوشه‌بندی جدیدی را معرفی می‌کنیم، که نسخه اصلاح‌شده روش خوشه‌بندی ممیزی بهینه است.‌ نتایج حاصل از شبیه‌سازی حاکی از کارآیی این روش در مواجهه با ابعاد بالای متغیرها و همچنین برتری آن نسبت به روش مولفه‌های اصلی، مورد ارزیابی قرار گرفته است.‌
کلید واژه ها (نمایه ها):
#خوشه‌بندی ممیزی بهینه #خوشه‌بندی ممیزی بهینه اصلاح‌شده #انتخاب متغیر #اعتبارسنجی متقاطع
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)