پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع دکتری > سال 1400
پدیدآورندگان:
امین قاضی زاهدی [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، منصور فاتح[استاد مشاور]
چکیده:
عبارت کلیدی نشاندهنده و بیانگر مفاهیم اساسی برای یک متن است. هدف استخراج خودکار عبارات کلیدی، شناسایی کلمات کلیدی از متن ورودی است. عبارات کلیدی در دو وضعیت ظاهرشده و ظاهرنشده هستند. در روشهای متداول، ساختاری مختص مدلسازی عبارات ظاهرنشده وجود ندارد. درصورتیکه عبارات کلیدی ظاهرنشده بخش قابلتوجهی از عبارات کلیدی یک سند را تشکیل میدهند. اینگونه موارد با صحت مناسبی شناسایی نمی شوند. چالش دیگر، تولید باکیفیت عبارات کلیدی نهایی از جهت چینش، ترکیب کلمات و خوانایی و عدم تولید موارد تکراری است. بهطورکلی سه روش پیشنهادی در این رساله با رویکردی نوآورانه بر پایه توجه ویژه بر مدلسازی عبارات ظاهرنشده و تولید نهایی مناسبتر مطرح شده است. در روش اول، مدلی جهت استخراج مفاهیم اساسی متن با استفاده از تخمین متون مشابه و اضافه کردن عبارات کلیدی ظاهرنشده به لایههای مخفی شبکه عمیق، ارائه شده است. طبق تحقیقات این پژوهش، اسناد همخوشه، اشتراک مناسبی در عبارات کلیدی مستقیماً ظاهرنشده دارند. در روش دوم، تلاش برای بهبود ساختار شبکه از لحاظ لایههای مختلف بر اساس مکانیسم توجه است. این تغییرات علاوه بر بهبود حافظه توالیها و تولید کمتر موارد تکراری، روش را برای دیگر کاربردها ازجمله خلاصهسازی متن مستعد میسازد. درنهایت، روش پیشنهادی سوم با استفاده از رویکرد ترکیبی شبکه مولد متقابل با بهینهسازی یادگیری تقویتی، کیفیت ویژهای خصوصاً در تولید توالی عبارات نهایی ایجاد میکند. کلیه روشها روی چهار دادگان متداول در این حوزه آزمایش شده است. نتایج این آزمایشها، نشان میدهد که روش پیشنهادی سوم (GANUnseen)، علاوه بر رفع چالشهای مطرحشده بهطور میانگین بهبود ۴،۲ درصدی نسبت به روش CorrRNN در استخراج عبارات کلیدی را داشته است.
کلید واژه ها (نمایه ها):
#کلمات کلیدی: استخراج خودکار عبارات کلیدی #یادگیری عمیق #تعبیه کلمات #شبکه خوشهبندی عمیق #مدلسازی دنباله به دنباله. Abstract
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: