پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1402
پدیدآورندگان:
سیده مهلا حسامی فر [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]
چکیده: با توجه ‌به رشد روزافزون استفادۀ مردم از وبگاه‌های خبری و تعدد اخبار منتشر شده دررابطه‌ با یک موضوع خاص، فهم روند رخداد یک موضوع منحصربه‌فرد به کاری دشوار تبدیل شده است. این مهم، پژوهشگران حوزۀ داده‌کاوی را بر آن واداشته تا با تولید و خلاصه‌سازی خطوط سیر زمانی و در دسترس قراردادن آنها برای عموم افراد، به درک سریع‌تر موضوعات خبری رخ‌داده در طی زمان کمک کنند. خطوط سیر زمانی دنباله‌ای از اتفاقات مهم را به نمایش می‌گذارند که در نهایت منجر به حصول نتیجه‌ای خاص گردیده‌اند. تولید دستی خطوط سیر زمانی کاری طاقت ‌فرساست که نیازمند وقت و هزینۀ بسیاری است. با تولید یک سیستم ایجاد و خلاصه‌سازی خطّ سیر زمانی، می‌توان اخبار را به شکلی مؤثر در اختیار خوانندگان قرارداد بی‌ آنکه نیاز به‌ صرف وقت و هزینۀ فراوانی باشد. متأسفانه، با توجه‌ به پژوهش‌های صورت‌گرفته، هیچ تحقیقاتی در زبان فارسی برای تولید و خلاصه‌سازی خطوط سیر زمانی انجام نشده و به‌ تبع، هیچ مجموعه‌داده‌ای به زبان فارسی برای این منظور یافت نمی‌شود. بنابراین، سعی گردیده است تا در وهلۀ اول با جمع‌آوری مجموعه‌داده‌ای فارسی‌زبان از اخبار دیجیتال منتشر شده تحت 4 موضوع از 4 خبرگزاری، مقدمات را برای تحقیق در این ‌رابطه، مهیا ساخت. در گام بعدی تلاش بر آن است تا با ایجاد و ارائۀ الگوریتم‌های تولید و خلاصه‌سازی خطوط سیر زمانی به خطوط سیر زمانی معتبر و کارآمدی بدون دخالت انسان دست یافت و در نهایت خطوط سیر زمانی تولید شده توسط الگوریتم‌های خودکار را با خطوط سیر زمانی ایجاد شده توسط متخصصان انسانی مقایسه کرد تا بتوان از صحت و دقت الگوریتم‌ها اطمینان حاصل کرد. آزمایشات صورت گرفته، حاکی از بهبود دقت الگوریتم نسبت به الگوریتم‌های پیشین می‌باشند.
کلید واژه ها (نمایه ها):
#خطّ سیر زمانی #خلاصه‌سازی خطوط سیر زمانی #خلاصه‌سازی اخبار #ارزیابی خطوط سیر زمانی #مجموعه داده فارسی زبان.
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)