پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1403
پدیدآورندگان:
معصومه رضایی آهوانویی [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]، مریم خدابخش[استاد مشاور]
چکیده: با انفجار اطلاعات در جامعه مدرن، حجم عظیمی از مقالات خبری به طور مداوم در اینترنت توسط خبرگزاری-های مختلف تولید می‌شود. خلاصه کردن حجم عظیمی از مقالات خبری روزانه که ممکن است موضوعات متنوعی را پوشش دهد و حاوی اطلاعات اضافی یا همپوشان باشد، برای خوانندگان عادی دشوار است. بسیاری از کاربران برنامه‌های خبری این تجربه را دارند که با اطلاعات بسیار زائد در مورد تعدادی از رویدادهای داغ جاری مواجه شده‌اند، درحالی‌که هنوز نمی‌توانند اطلاعاتی در مورد رویدادهایی که واقعاً به آن‌ها علاقه دارند به دست آورند. علاوه بر این، موتورهای جستجو بازیابی اسناد را از مجموعه‌های بزرگ بر اساس پرس‌وجوهای وارد شده توسط کاربر انجام می‌دهند. بااین‌حال، آن‌ها راهی منطقی برای مشاهده موضوعات پرطرف‌دار یا اخبار فوری برای کاربران ارائه نمی‌دهند. یک راه جایگزین نوظهور برای ارائه مجموعه‌های خبری بدون پرس‌وجوهای از پیش تعیین شده، سازماندهی و ارائه مقالات خبری از طریق خلاصه‌سازی خط سیر زمانی است. خلاصه‌سازی خط سیر زمانی روشی مؤثر برای کمک به خوانندگان مقالات خبری آنلاین برای پیگیری اخبار طولانی‌مدت است. این روش به طور خودکار برای تاریخ‌های کلیدی، رویدادهای مهم را شناسایی می‌کند و خلاصه کوتاهی از آنچه در این تاریخ‌ها اتفاق افتاده است ارائه می‌دهد. اکثر کارها در خلاصه‌سازی خط سیر زمانی بر بهبود عملکرد خلاصه‌سازی تمرکز کرده‌اند. بااین‌حال این روش ها دارای ایراداتی هستند شامل: (الف) روش‌ها اساساً روی یک نوع همگن از مجموعه‌داده‌ها کار می‌کنند. (ب) خروجی معمولاً یک خط سیر زمانی واحد بدون توجه به‌اندازه و پیچیدگی مجموعه‌داده ورودی است. در این پایان نامه قصد داریم با استفاده از روش خلاصه‌سازی خط سیر زمانی چندگانه انعطاف‌پذیری و تطبیق‌پذیری خلاصه‌سازی خط سیر زمانی را توسعه دهیم. باتوجه‌به مجموعه‌ ای از مقالات خبری دارای مهر زمانی، روش ما با استفاده از دو مرحله خوشه بندی داستان‌های مهم و درعین‌حال متفاوت را کشف می‌کند و یک خط سیر زمانی مربوط به هر داستان ایجاد می‌کند. ما در این روش از دو ماژول اصلی برای رسیدن به اهداف خود بهره گرفتیم که شامل ماژول تولید رویداد و ماژول تولید خط سیر زمانی است. در نهایت خطوط سیر زمانی تولید شده توسط الگوریتم خود را با یک یا چند خلاصه استاندارد مرجع که به‌صورت دستی توسط متخصصان انسانی ساخته شده‌اند مقایسه کردیم تا از صحت و دقت الگوریتم خود اطمینان حاصل کنیم. آزمایش‌های صورت‌گرفته نشان می‌دهد الگوریتم پیشنهادی بهبودی برابر 8.8% درصد در امتیاز ROUGE-1و 1.3% درصد در امتیاز ROUGE-2 نسبت به الگوریتم مشابه (یو و همکاران 2021) داشته است.
کلید واژه ها (نمایه ها):
#مقالات خبری #رویداد #خلاصه‌سازی #خط سیر زمانی #خط سیر زمانی چندگانه #خوشه‌بندی
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)