پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1403
پدیدآورندگان:
معصومه رضایی آهوانویی [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]، مریم خدابخش[استاد مشاور]
چکیده: با انفجار اطلاعات در جامعه مدرن، حجم عظیمی از مقالات خبری به طور مداوم در اینترنت توسط خبرگزاری-های مختلف تولید میشود. خلاصه کردن حجم عظیمی از مقالات خبری روزانه که ممکن است موضوعات متنوعی را پوشش دهد و حاوی اطلاعات اضافی یا همپوشان باشد، برای خوانندگان عادی دشوار است. بسیاری از کاربران برنامههای خبری این تجربه را دارند که با اطلاعات بسیار زائد در مورد تعدادی از رویدادهای داغ جاری مواجه شدهاند، درحالیکه هنوز نمیتوانند اطلاعاتی در مورد رویدادهایی که واقعاً به آنها علاقه دارند به دست آورند. علاوه بر این، موتورهای جستجو بازیابی اسناد را از مجموعههای بزرگ بر اساس پرسوجوهای وارد شده توسط کاربر انجام میدهند. بااینحال، آنها راهی منطقی برای مشاهده موضوعات پرطرفدار یا اخبار فوری برای کاربران ارائه نمیدهند.
یک راه جایگزین نوظهور برای ارائه مجموعههای خبری بدون پرسوجوهای از پیش تعیین شده، سازماندهی و ارائه مقالات خبری از طریق خلاصهسازی خط سیر زمانی است. خلاصهسازی خط سیر زمانی روشی مؤثر برای کمک به خوانندگان مقالات خبری آنلاین برای پیگیری اخبار طولانیمدت است. این روش به طور خودکار برای تاریخهای کلیدی، رویدادهای مهم را شناسایی میکند و خلاصه کوتاهی از آنچه در این تاریخها اتفاق افتاده است ارائه میدهد.
اکثر کارها در خلاصهسازی خط سیر زمانی بر بهبود عملکرد خلاصهسازی تمرکز کردهاند. بااینحال این روش ها دارای ایراداتی هستند شامل: (الف) روشها اساساً روی یک نوع همگن از مجموعهدادهها کار میکنند. (ب) خروجی معمولاً یک خط سیر زمانی واحد بدون توجه بهاندازه و پیچیدگی مجموعهداده ورودی است.
در این پایان نامه قصد داریم با استفاده از روش خلاصهسازی خط سیر زمانی چندگانه انعطافپذیری و تطبیقپذیری خلاصهسازی خط سیر زمانی را توسعه دهیم. باتوجهبه مجموعه ای از مقالات خبری دارای مهر زمانی، روش ما با استفاده از دو مرحله خوشه بندی داستانهای مهم و درعینحال متفاوت را کشف میکند و یک خط سیر زمانی مربوط به هر داستان ایجاد میکند. ما در این روش از دو ماژول اصلی برای رسیدن به اهداف خود بهره گرفتیم که شامل ماژول تولید رویداد و ماژول تولید خط سیر زمانی است.
در نهایت خطوط سیر زمانی تولید شده توسط الگوریتم خود را با یک یا چند خلاصه استاندارد مرجع که بهصورت دستی توسط متخصصان انسانی ساخته شدهاند مقایسه کردیم تا از صحت و دقت الگوریتم خود اطمینان حاصل کنیم. آزمایشهای صورتگرفته نشان میدهد الگوریتم پیشنهادی بهبودی برابر 8.8% درصد در امتیاز ROUGE-1و 1.3% درصد در امتیاز ROUGE-2 نسبت به الگوریتم مشابه (یو و همکاران 2021) داشته است.
کلید واژه ها (نمایه ها):
#مقالات خبری #رویداد #خلاصهسازی #خط سیر زمانی #خط سیر زمانی چندگانه #خوشهبندی
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: