پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1396
پدیدآورندگان:
مهرداد کاهه [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]
چکیده: ساخت سیستمی که بتواند به صورت موثری فاصله بین دو عبارت را تعیین کند همواره مورد توجه محققین زمینههای هوش مصنوعی و بازیابی اطلاعات بوده است. معیارهای شباهت دو عبارت در طیف گستردهای از برنامههای کاربردی همچون پردازش زبانهای طبیعی، اصلاح پرسوجوهای جستجو، غلطیابی معنایی، جلوگیری از دستبردهای علمی، مقایسه اسناد و دیگر زمینههای کاربردی در بازیابی اطلاعات به کار میرود. ورودی سیستمهای تشخیصدهنده میتواند یک متن و یا مجموعهای از اسناد و متون باشد و خروجی آن نتیجه قضاوت سیستم در مورد مشابهت جملات ورودی متون و میزان شباهت آنها است. در نهایت نزدیک بودن قضاوت سیستم به قضاوت انسان نشاندهنده عملکرد خوب سیستم است.
در این تحقیق روشی برای محاسبه شباهت لغوی مبتنی بر عدم قطعیت ارائه مینماییم. برای این منظور از روشهای مبتنی بر اثر انگشت و تکنیک Winnowing به عنوان تکنیکهای محاسبه شباهت استفاده مینماییم. همچنین با در نظر گرفتن چندین پارامتر جهت محاسبه شابهت عبارات، از سیستم استنتاج فازی برای تصمیمگیری در شرایط عدم قطعیت استفاده نمودهایم. در این روش ویژگیهایی مبتنی بر تکنیک هشگذاری و دگردیسیهای کلی جملات تعریف شده است که این معیارها از سرعت و دقت مناسبی برخوردار هستند. پس از محاسبه شباهت متون، جملات مشابه نیز توسط سیستم استخراج میگردد. روش مذکور بر روی پیکره PAN فارسی و پیکره ارزیابی شباهت عبارات دانشگاه صنعتی شاهرود مورد ارزیابی قرار گرفته است که با دقت 78 درصد، اسناد را به سه کلاس متفاوت، نسبتاً مشابه و مشابه تفکیک مینماید.
کلید واژه ها (نمایه ها):
#شباهت سنجی لغوی #سرقت ادبی #سیستم استنتاج فازی #اثر انگشت #winnowing دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: