پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1396
پدیدآورندگان:
مهرداد کاهه [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]
چکیده: ساخت سیستمی که بتواند به صورت موثری فاصله بین دو عبارت را تعیین کند همواره مورد توجه محققین زمینه‌های هوش مصنوعی و بازیابی اطلاعات بوده است. معیار‌های شباهت دو عبارت در طیف گسترده‌ای از برنامه‌های کاربردی همچون پردازش زبان‌های طبیعی، اصلاح پرس‌و‌جو‌های جستجو، غلط‌یابی معنایی، جلوگیری از دستبرد‌های علمی، مقایسه اسناد و دیگر زمینه‌های کاربردی در بازیابی اطلاعات به کار می‌رود. ورودی سیستم‌های تشخیص‌دهنده می‌تواند یک متن و یا مجمو‌عه‌ای از اسناد و متون باشد و خروجی آن نتیجه قضاوت سیستم در مورد مشابهت جملات ورودی متون و میزان شباهت آنها است. در نهایت نزدیک بودن قضاوت سیستم به قضاوت انسان نشان‌دهنده عملکرد خوب سیستم است. در این تحقیق روشی برای محاسبه شباهت لغوی مبتنی بر عدم قطعیت ارائه می‌نماییم. برای این منظور از روش‌های مبتنی بر اثر انگشت و تکنیک Winnowing به عنوان تکنیک‌های محاسبه شباهت استفاده می‌نماییم. همچنین با در نظر گرفتن چندین پارامتر جهت محاسبه شابهت عبارات، از سیستم استنتاج فازی برای تصمیم‌گیری در شرایط عدم قطعیت استفاده نموده‌ایم. در این روش ویژگی‌هایی مبتنی بر تکنیک هش‌گذاری و دگردیسی‌های کلی جملات تعریف شده است که این معیار‌ها از سرعت و دقت مناسبی برخوردار هستند. پس از محاسبه شباهت متون، جملات مشابه نیز توسط سیستم استخراج می‌گردد. روش مذکور بر روی پیکره PAN فارسی و پیکره ارزیابی شباهت عبارات دانشگاه صنعتی شاهرود مورد ارزیابی قرار گرفته است که با دقت 78 درصد، اسناد را به سه کلاس متفاوت، نسبتاً مشابه و مشابه تفکیک می‌نماید.
کلید واژه ها (نمایه ها):
#شباهت سنجی لغوی #سرقت ادبی #سیستم استنتاج فازی #اثر انگشت #winnowing

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)