پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1401
پدیدآورندگان:
سیده محدثه سیدی باغسنگانی [پدیدآور اصلی]، مرضیه رحیمی[استاد راهنما]، فاطمه جعفری نژاد[استاد مشاور]
چکیده:
مدلهای موضوعی یک ابزار قدرتمند برای تجزیه و تحلیل مجموعههای بزرگ متنی بدون ساختار هستند که در بسیاری از زمینهها مانند مهندسی نرمافزار، علوم سیاسی و زبانشناسی کاربرد دارند. به منظور بهبود عملکرد مدلهای موضوعی، لازم است که همانند هر مدل دیگری در حوزه یادگیری ماشین، ابتدا معیاری برای ارزیابی آنها تعریف شود. هر موضوع در مدل موضوعی به شکل مجموعهای از کلمات نمایش داده میشود که در صورت انسجام آن موضوع، با یکدیگر همبستگی معنایی تنگاتنگی دارند. همبستگی معنایی کلمات معرف یک موضوع بسته به تشخیص انسانی است؛ اما از آنجا که اکثر مدلهای موضوعی به صورت کاملا بیناظر و بدون دخالت انسان تولید میشوند، سنجش انسجام آنها همواره با چالش روبرو بوده است.
در این پایاننامه، یک معیار برای ارزیابی انسجام مدلهای موضوعی پیشنهاد شده است که بر شباهت بردارهای جفت کلمات استوار است. بردارهای مورد استفاده در روش پیشنهادی، بردارهای تعبیه کلمات هستند که با استفاده از آموزش شبکههای عصبی کمعمق یا عمیق بر روی مجموعههای بسیار بزرگ متون تولید میشوند و بنابراین در مقایسه با بردارهای ساخته شده بر اساس تعداد و همرخدادی خالص کلمات، دقیقتر و معنادارتر خواهند بود. همچنین، برای محاسبه تشابه جفت کلمات هر موضوع، از رتبه ویژگیهای بردارهای کلمات به جای مقدار خالص عناصر بردار استفاده شده است و این امر، میزان همبستگی این معیار را با تشخیص انسانی بالا برده و به 82 درصد میرساند.
علاوه بر این معیار ارزیابی انسجام، یک روش برای نمایش مدلهای موضوعی هم در این پایاننامه پیشنهاد شده که رابطه میان موضوعات را بر اساس بردارهای تعبیه کلمات برتر آنها نمایش میدهد.
کلید واژه ها (نمایه ها):
#مدل موضوعی #انسجام #LDA #تعبیه کلمات #بردار کلمات
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: