پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1398
پدیدآورندگان:
مرتضی اله پور [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، هدی مشایخی[استاد مشاور]
چکیده: امروزه با توجه به افزایش حجم اطلاعات و مستندات در زمینه های مختلف، دسترسی سریع به اطلاعات مورد نظر برای هر فرد از اهمیت ویژه ای برخوردار است.
از این رو علاوه بر تکنیکهای بازیابی اطلاعات، تکنیکهای خلاصه سازی و دسته بندی نیز میتواند کمک موثری در افزایش سرعت دسترسی کاربران به اسناد مورد نظرشان باشد.
ساخت سیستمی که بتواند به صورت موثری شباهت بین دو عبارت را تشخیص دهد موضوع بسیاری از پژوهش ها بوده است. تعیین شباهت بین دو عبارت میتواند از طریق محاسبه شباهت میان واژهها و یا توسط روشهای یادگیری ماشین انجام شود.
در این تحقیق روشی ارائه میشود که با توجه معنای کلمات در هر جمله، شباهت بین جملهها را مشخص میکند. برای بدست آوردن معنای هر کلمه از مدلهای جایگذاری کلمات استفاده میکنیم. یکی از ویژگیهای این مدلها این است که هر کلمه را در یک فضای چند بعدی نشان میدهند در نتیجه با عملیات مختلف بردارها مانند جمع دوبردار میتوان معنای حاصل از همجواری دو کلمه را بدست آورد. در ادامه به کمک چهار تابع استخراج ویژگی، ویژگیهای مخلفی از جملهها استخراج میشود سپس از این ویژگیها در یک دستهبند استفاده میشود تا شباهت یا عدمشباهت دو جمله تشخیص داده شود.
در ساخت چنین سیستمی یکی از مولفههای مهم و اساسی توانایی تشخیص شباهت بین جملات و پارگرافهای متون است که موضوع تحقیقات بسیار زیادی بوده است. این روش میتواند شباهت معنایی بین دو جمله را علیرغم عدم شباهت لغوی آنها تشخیص دهد. این روش علاوه بر تشخیص شباهت، در تشخیص عدم شباهت دو عبارت نیز کارآمد است به طوری که پس انجام آزمایشات این روش با دقت 83درصد دادههای مورد آزمایش را دستهبندی کرد که در مقایسه با روشهای معرفی شده، عملکرد بهتری دارد.
کلید واژه ها (نمایه ها):
#جایگذاری کلمات #شباهت متون #پردازش متن #متنکاوی دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: