پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1401
پدیدآورندگان:
سیده محدثه سیدی باغسنگانی [پدیدآور اصلی]، مرضیه رحیمی[استاد راهنما]، فاطمه جعفری نژاد[استاد مشاور]
چکیده: مدل‌های موضوعی یک ابزار قدرتمند برای تجزیه و تحلیل مجموعه‌های بزرگ متنی بدون ساختار هستند که در بسیاری از زمینه‌ها مانند مهندسی نرم‌افزار، علوم سیاسی و زبان‌شناسی کاربرد دارند. به منظور بهبود عملکرد مدل‌های موضوعی، لازم است که همانند هر مدل دیگری در حوزه‌ یادگیری ماشین، ابتدا معیاری برای ارزیابی آن‌ها تعریف شود. هر موضوع در مدل موضوعی به شکل مجموعه‌ای از کلمات نمایش داده می‌شود که در صورت انسجام آن موضوع، با یکدیگر همبستگی معنایی تنگاتنگی دارند. همبستگی معنایی کلمات معرف یک موضوع بسته به تشخیص انسانی است؛ اما از آنجا که اکثر مدل‌های موضوعی به صورت کاملا بی‌ناظر و بدون دخالت انسان تولید می‌شوند، سنجش انسجام آن‌ها همواره با چالش روبرو بوده است. در این پایان‌نامه، یک معیار برای ارزیابی انسجام مدل‌های موضوعی پیشنهاد شده است که بر شباهت بردارهای جفت کلمات استوار است. بردارهای مورد استفاده در روش پیشنهادی، بردارهای تعبیه کلمات هستند که با استفاده از آموزش شبکه‌های عصبی کم‌عمق یا عمیق بر روی مجموعه‌های بسیار بزرگ متون تولید می‌شوند و بنابراین در مقایسه با بردارهای ساخته شده بر اساس تعداد و هم‌رخدادی خالص کلمات، دقیق‌تر و معنادارتر خواهند بود. همچنین، برای محاسبه تشابه جفت کلمات هر موضوع، از رتبه ویژگی‌های بردارهای کلمات به جای مقدار خالص عناصر بردار استفاده شده است و این امر، میزان همبستگی این معیار را با تشخیص انسانی بالا برده و به 82 درصد می‌رساند. علاوه بر این معیار ارزیابی انسجام، یک روش برای نمایش مدل‌های موضوعی هم در این پایان‌نامه پیشنهاد شده که رابطه میان موضوعات را بر اساس بردارهای تعبیه کلمات برتر آن‌ها نمایش می‌دهد.
کلید واژه ها (نمایه ها):
#مدل موضوعی #انسجام #LDA #تعبیه کلمات #بردار کلمات
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)