پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1402
پدیدآورندگان:
سیده زینب سیدی قرقی [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]
چکیده:
برچسبگذاری خودکار خوشهها رویکردی در آنالیز داده است که بهمنظور تفسیرپذیر کردن نتایج خوشهبندی استفاده میگردد. دادهها در دنیای واقعی از انواع مختلفی تشکیل شدهاند، دادههای عددی و اسمی از انواع رایج آنها هستند. پژوهشهای پیشین عموماً به برچسبگذاری خوشههایی با دادههای عددی یا اسمی پرداختهاند و برچسبگذاری خوشههایی با دادههای مختلط کمتر بررسی شده است؛ بنابراین در این پایاننامه چهارچوبی برای برچسبگذاری خودکار خوشههای با دادههای عددی و اسمی پیشنهاد میشود. برچسبهای تولید شده برای هر خوشه یکتا هستند و بهصورت ویژگی – مقدار تولید میشوند. انتظار میرود برچسب هر خوشه دارای بیشترین دقت و کمترین طول باشد. چهارچوب ارائه شده در این پایاننامه متشکل از روشی بدون نظارت برای خوشهبندی دادهها، یک الگوریتم جهت گسستهسازی ویژگیهای عددی و یک رویکرد نظارت شده مبتنی بر شبکههای عصبی مصنوعی جهت انتخاب ویژگیهای مرتبط با هر خوشه است. در چهارچوب پیشنهادی استفاده از الگوریتم گسستهسازی ترکیبی، کاهش ازدسترفتن اطلاعات در مرحله گسستهسازی را به دنبال دارد و همین امر باعث میشود برچسب، بادقت بیشتری هر خوشه را توصیف کند. برچسبهای تولید شده توسط این چهارچوب، عملکرد گسترشیافتهای را نشان میدهند و از روی مجموعهدادههای واقعی بهدستآمدهاند. میانگین دقت برچسبگذاری بر روی مجموعهدادههای (Iris, Seeds, Glass) 98.29% میباشد. دقت بهدستآمده در مقایسه با میانگین دقت کارهای پیشین (Moura و همکاران 2022) و (Lopes و همکاران 2016) به ترتیب بهاندازه %1.09 و %5.4 بیشتر میباشد. همچنین برچسبهای تولید شده در این تحقیق نسبت به برچسبهای تولید شده در کارهای پیشین، در بیشتر موارد میتوانند با کمترین ویژگی – مقدار به توصیف خوشهها بپردازند.
کلید واژه ها (نمایه ها):
#برچسبگذاری خودکار #خوشهبندی #مجموعهدادههای مختلط #دادههای عددی #دادههای اسمی #گسستهسازی
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: