پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1402
پدیدآورندگان:
سیده زینب سیدی قرقی [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]
چکیده: برچسب‌گذاری خودکار خوشه‌ها رویکردی در آنالیز داده است که به‌منظور تفسیرپذیر کردن نتایج خوشه‌بندی استفاده می‌گردد. داده‌ها در دنیای واقعی از انواع مختلفی تشکیل شده‌اند، داده‌های عددی و اسمی از انواع رایج آن‌ها هستند. پژوهش‌های پیشین عموماً به برچسب‌گذاری خوشه‌هایی با داده‌های عددی یا اسمی پرداخته‌اند و برچسب‌گذاری خوشه‌هایی با داده‌های مختلط کمتر بررسی شده است؛ بنابراین در این پایان‌نامه چهارچوبی برای برچسب‌گذاری خودکار خوشه‌های با داده‌های عددی و اسمی پیشنهاد می‌شود. برچسب‌های تولید شده برای هر خوشه یکتا هستند و به‌صورت ویژگی – مقدار تولید می‌شوند. انتظار می‌رود برچسب هر خوشه دارای بیشترین دقت و کمترین طول باشد. چهارچوب ارائه شده در این پایان‌نامه متشکل از روشی بدون نظارت برای خوشه‌بندی داده‌ها، یک الگوریتم جهت گسسته‌سازی ویژگی‌های عددی و یک رویکرد نظارت شده مبتنی بر شبکه‌های عصبی مصنوعی جهت انتخاب ویژگی‌های مرتبط با هر خوشه است. در چهارچوب پیشنهادی استفاده از الگوریتم گسسته‌سازی ترکیبی، کاهش ازدست‌رفتن اطلاعات در مرحله گسسته‌سازی را به دنبال دارد و همین امر باعث می‌شود برچسب، بادقت بیشتری هر خوشه را توصیف کند. برچسب‌های تولید شده توسط این چهارچوب، عملکرد گسترش‌یافته‌ای را نشان می‌دهند و از روی مجموعه‌داده‌های واقعی به‌دست‌آمده‌اند. میانگین دقت برچسب‌گذاری بر روی مجموعه‌داده‌های (Iris, Seeds, Glass) 98.29% می‌باشد. دقت به‌دست‌آمده در مقایسه با میانگین دقت کارهای پیشین (Moura و همکاران 2022) و (Lopes و همکاران 2016) به ترتیب به‌اندازه %1.09 و %5.4 بیشتر می‌باشد. همچنین برچسب‌های تولید شده در این تحقیق نسبت به برچسب‌های تولید شده در کارهای پیشین، در بیشتر موارد می‌توانند با کم‌ترین ویژگی – مقدار به توصیف خوشه‌ها بپردازند.
کلید واژه ها (نمایه ها):
#برچسب‌گذاری خودکار #خوشه‌بندی #مجموعه‌داده‌های مختلط #داده‌های عددی #داده‌های اسمی #گسسته‌سازی
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)