پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1402
پدیدآورندگان:
سیده مهلا حسامی فر [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]
چکیده:
با توجه به رشد روزافزون استفادۀ مردم از وبگاههای خبری و تعدد اخبار منتشر شده دررابطه با یک موضوع خاص، فهم روند رخداد یک موضوع منحصربهفرد به کاری دشوار تبدیل شده است. این مهم، پژوهشگران حوزۀ دادهکاوی را بر آن واداشته تا با تولید و خلاصهسازی خطوط سیر زمانی و در دسترس قراردادن آنها برای عموم افراد، به درک سریعتر موضوعات خبری رخداده در طی زمان کمک کنند. خطوط سیر زمانی دنبالهای از اتفاقات مهم را به نمایش میگذارند که در نهایت منجر به حصول نتیجهای خاص گردیدهاند. تولید دستی خطوط سیر زمانی کاری طاقت فرساست که نیازمند وقت و هزینۀ بسیاری است. با تولید یک سیستم ایجاد و خلاصهسازی خطّ سیر زمانی، میتوان اخبار را به شکلی مؤثر در اختیار خوانندگان قرارداد بی آنکه نیاز به صرف وقت و هزینۀ فراوانی باشد.
متأسفانه، با توجه به پژوهشهای صورتگرفته، هیچ تحقیقاتی در زبان فارسی برای تولید و خلاصهسازی خطوط سیر زمانی انجام نشده و به تبع، هیچ مجموعهدادهای به زبان فارسی برای این منظور یافت نمیشود.
بنابراین، سعی گردیده است تا در وهلۀ اول با جمعآوری مجموعهدادهای فارسیزبان از اخبار دیجیتال منتشر شده تحت 4 موضوع از 4 خبرگزاری، مقدمات را برای تحقیق در این رابطه، مهیا ساخت. در گام بعدی تلاش بر آن است تا با ایجاد و ارائۀ الگوریتمهای تولید و خلاصهسازی خطوط سیر زمانی به خطوط سیر زمانی معتبر و کارآمدی بدون دخالت انسان دست یافت و در نهایت خطوط سیر زمانی تولید شده توسط الگوریتمهای خودکار را با خطوط سیر زمانی ایجاد شده توسط متخصصان انسانی مقایسه کرد تا بتوان از صحت و دقت الگوریتمها اطمینان حاصل کرد. آزمایشات صورت گرفته، حاکی از بهبود دقت الگوریتم نسبت به الگوریتمهای پیشین میباشند.
کلید واژه ها (نمایه ها):
#خطّ سیر زمانی #خلاصهسازی خطوط سیر زمانی #خلاصهسازی اخبار #ارزیابی خطوط سیر زمانی #مجموعه داده فارسی زبان.
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: