پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع دکتری > سال 1400
پدیدآورندگان:
امین قاضی زاهدی [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، منصور فاتح[استاد مشاور]
چکیده: عبارت کلیدی نشان‌دهنده و بیانگر مفاهیم اساسی برای یک متن است. هدف استخراج خودکار عبارات کلیدی، شناسایی کلمات کلیدی از متن ورودی است. عبارات کلیدی در دو وضعیت ظاهرشده و ظاهرنشده هستند. در روش‌های متداول، ساختاری مختص مدل‌سازی عبارات ظاهرنشده وجود ندارد. درصورتی‌که عبارات کلیدی ظاهرنشده بخش قابل‌توجهی از عبارات کلیدی یک سند را تشکیل می‌دهند. این‌گونه موارد با صحت مناسبی شناسایی نمی شوند. چالش دیگر، تولید باکیفیت عبارات کلیدی نهایی از جهت چینش، ترکیب کلمات و خوانایی و عدم تولید موارد تکراری است. به‌طورکلی سه روش پیشنهادی در این رساله با رویکردی نوآورانه بر پایه توجه ویژه بر مدل‌سازی عبارات ظاهرنشده و تولید نهایی مناسب‌تر مطرح شده است. در روش اول، مدلی جهت استخراج مفاهیم اساسی متن با استفاده از تخمین متون مشابه و اضافه کردن عبارات کلیدی ظاهرنشده به لایه‌های مخفی شبکه عمیق، ارائه شده است. طبق تحقیقات این پژوهش، اسناد هم‌خوشه، اشتراک مناسبی در عبارات کلیدی مستقیماً ظاهرنشده دارند. در روش دوم، تلاش برای بهبود ساختار شبکه از لحاظ لایه‌های مختلف بر اساس مکانیسم توجه است. این تغییرات علاوه بر بهبود حافظه توالی‌ها و تولید کمتر موارد تکراری، روش را برای دیگر کاربردها ازجمله خلاصه‌سازی متن مستعد می‌سازد. درنهایت، روش پیشنهادی سوم با استفاده از رویکرد ترکیبی شبکه مولد متقابل با بهینه‌سازی یادگیری تقویتی، کیفیت ویژه‌ای خصوصاً در تولید توالی عبارات نهایی ایجاد می‌کند. کلیه روش‌ها روی چهار دادگان متداول در این حوزه آزمایش ‌شده است. نتایج این آزمایش‌ها، نشان می‌دهد که روش پیشنهادی سوم (GANUnseen)، علاوه بر رفع چالش‌های مطرح‌شده به‌طور میانگین بهبود ۴،۲ درصدی نسبت به روش CorrRNN در استخراج عبارات کلیدی را داشته است.
کلید واژه ها (نمایه ها):
#کلمات کلیدی: استخراج خودکار عبارات کلیدی #یادگیری عمیق #تعبیه کلمات #شبکه خوشه‌بندی عمیق #مدل‌سازی دنباله به دنباله.  Abstract
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)