پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1390
پدیدآورندگان:
حمزه هدهدکیان [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، حمید حسن پور[استاد راهنما]
چکیده: به طور کلی، روش های ارائه شده جهت استخراج خودکار کلمات کلیدی، سعی در بدست آوردن نتایج بهتر در معیارهایی مانند بازخوانی و دقت دارند. اگرچه این معیارها، میزان کارایی روش استخراج کلمات کلیدی در نقش یک انسان را نشان می دهد اما با توجه به نقش غیرقابل انکار موتورهای جستجو در دنیای امروز، به نظر می رسد که در انتخاب کلمات کلیدی علاوه بر توجه به معیارهای رایج بازیابی اطلاعات باید به افزایش میزان دسترسی پذیری متن توسط موتورهای جستجو نیز توجه ویژه ای شود. در این تحقیق روشی جدید برای استخراج خودکار کلمات کلیدی ارائه شده است که همزمان با افزایش دسترسی پذیری متن، امتیاز مناسبی در معیارهای بازخوانی و دقت نیز کسب می کند. روش ارائه برای استخراج کلمات کلیدی از دو تابع امتیاز دهی استفاده می کند: تابع امتیاز دهی به کلمات کلیدی و تابع ارزیابی میزان دسترسی پذیری. تابع اول سعی در بالا بردن بازخوانی و دقت دارد در حالیکه تابع دوم در طول فرایند آموزش با استفاده از الگوریتم ژنتیک و بازخوردهای موتورهای جستجو به بهینه سازی ضرایب خصوصیات درتابع اول می پردازد. همچنین در این پروژه با بهره گیری از کلمات برجسته ساز، فرایند پس پردازشی ارائه شده که با گزینش نهایی کلمات کلیدی از میان لیست کلمات کاندید، منجر به بهبود کارایی روش در معیار دقت می شود. آزمایشات نشان می دهد که با به کارگیری تعداد تکرار مناسب در طی فرایند آموزش و ایجاد موازنه منطقی در کسب هریک از سه معیار یاد شده می توان به نتایج مطلوبی در هر سه معیار دست یافت.
کلید واژه ها (نمایه ها):
#استخراج خودکار کلمات کلیدی #بهینه سازی نتایج موتورهای جستجو #کلمات پرتکرار فارسی #الگوریتم ژنتیک #کلمات برجسته ساز فارسی #بهبود معیار دقت #افزایش دسترسی پذیری
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)