پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1398
پدیدآورندگان:
مرتضی اله پور [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، هدی مشایخی[استاد مشاور]
چکیده: امروزه با توجه به افزایش حجم اطلاعات و مستندات در زمینه های مختلف، دسترسی سریع به اطلاعات مورد نظر برای هر فرد از اهمیت ویژه ای برخوردار است. از این رو علاوه بر تکنیک‌های بازیابی اطلاعات، تکنیک‌های خلاصه سازی و دسته بندی نیز میتواند کمک موثری در افزایش سرعت دسترسی کاربران به اسناد مورد نظرشان باشد. ساخت سیستمی که بتواند به صورت موثری شباهت بین دو عبارت را تشخیص دهد موضوع بسیاری از پژوهش ها بوده است. تعیین شباهت بین دو عبارت می‌تواند از طریق محاسبه شباهت میان واژه‌ها و یا توسط روش‌های یادگیری ماشین انجام شود. در این تحقیق روشی ارائه می‌شود که با توجه معنای کلمات در هر جمله، شباهت بین جمله‌ها را مشخص می‌کند. برای بدست آوردن معنای هر کلمه از مدل‌های جایگذاری کلمات استفاده می‌کنیم. یکی از ویژگی‌های این مدل‌ها این است که هر کلمه را در یک فضای چند بعدی نشان می‌دهند در نتیجه با عملیات مختلف بردارها مانند جمع دوبردار می‌توان معنای حاصل از هم‌جواری دو کلمه را بدست آورد. در ادامه به کمک چهار تابع استخراج ویژگی، ویژگی‌های مخلفی از جمله‌ها استخراج می‌شود سپس از این ویژگی‌ها در یک دسته‌بند استفاده می‌شود تا شباهت یا عدم‌شباهت دو جمله تشخیص داده شود. در ساخت چنین سیستمی یکی از مولفه‌های مهم و اساسی توانایی تشخیص شباهت بین جملات و پارگراف‌های متون است که موضوع تحقیقات بسیار زیادی بوده است. این روش می‌تواند شباهت معنایی بین دو جمله را علی‌رغم عدم شباهت لغوی آن‌ها تشخیص دهد. این روش علاوه بر تشخیص شباهت، در تشخیص عدم شباهت دو عبارت نیز کارآمد است به طوری که پس انجام آزمایشات این روش با دقت 83درصد داده‌های مورد آزمایش را دسته‌بندی کرد که در مقایسه با روش‌های معرفی شده، عملکرد بهتری دارد.
کلید واژه ها (نمایه ها):
#جایگذاری کلمات #شباهت متون #پردازش متن #متن‌کاوی

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)