پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1403
پدیدآورندگان:
مژگان اکابری [پدیدآور اصلی]، مریم خدابخش[استاد راهنما]
چکیده: چکیده گسترش و توسعه‌ی وب و افزایش اطلاعات دیجیتال، نیاز به سیستم‌های بازیابی اطلاعات (IR) قوی و موثر را تشدید کرده است. پیش‌بینی عملکرد پرس‌و‌جو (QPP) نقشی محوری در شناسایی پرس‌و‌جو‌های دشوار و بهبود روش‌‌های بازیابی ایفا می‌کند. با این حال، روش‌های QPP موجود از محدودیت‌های متعددی رنج می‌برند: (1) رویکردهای مبتنی بر امتیاز نمی‌توانند روابط ساختاری بین اسناد بازیابی شده را به تصویر بکشند (2) روش‌های نظارت شده به داده‌های آموزشی برچسب‌گذاری شده نیاز دارند و آن‌ها را برای حوزه‌های جدید پرهزینه و غیرعملی می‌سازد و (3) پیش‌بینی‌کننده‌های پس از بازیابی بدون نظارت، اغلب تنها بر پراکندگی امتیاز بازیابی تکیه می‌کنند و از اثرات خوشه‌بندی اسناد غفلت می‌کنند. برای پرداختن به این چالش‌ها، ما یک روش جدید QPP مبتنی بر خوشه‌بندی پس از بازیابی را پیشنهاد می‌کنیم. به طور خاص، ما سه پیش‌بینی‌کننده بدون نظارت را معرفی می‌نمائیم: تمایز خوشه‌بندی شده: که قابلیت تفکیک پرس‌و‌جوی خاص خوشه‌های بازیابی شده را اندازه‌گیری می‌کند. رانش پرس‌و‌جوی خوشه‌بندی شده: که انحراف اسناد با رتبه برتر را از هدف پرس‌و‌جو تخمین می‌زند و یک رویکرد ترکیبی که هر دو را ترکیب می‌کند. با تجزیه و تحلیل ساختار خوشه‌بندی اسناد بازیابی شده، روش ما قابلیت تفسیر را بهبود می‌بخشد و در عین حال نیاز به داده‌های برچسب دار را حذف می‌کند. ما عملکرد رویکرد خود را بر روی مجموعه داده‌‌ی رتبه‌بندی مقیاس بزرگ MS MARCO ارزیابی می‌کنیم. نتایج تجربی نشان می‌دهد که روش ما به طور قابل ‌توجهی بهتر از مدل‌های QPP مبتنی بر امتیاز پیشرفته عمل می‌کند. این یافته‌ها پتانسیل QPP آگاه از خوشه را برای تقویت سیستم‌های بازیابی اطلاعات و کاهش تأثیر پرس‌و‌جوهای دشوار برجسته می‌کند.
کلید واژه ها (نمایه ها):
#کلمات کلیدی: پیش‌بینی عملکرد پرس‌و‌جو #خوشه‌بندی اسناد #دشواری پرس‌و‌جو
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)