پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع دکتری > سال 1399
پدیدآورندگان:
سمیرا حورعلی [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، منصور فاتح[استاد مشاور]
چکیده: تحلیل هم ارجاعی یکی از گام های مهم در پردازش متن و یکی از راهکارهای اساسی برای ارتقاء عملکرد سیستم های مبتنی بر متن مانند استخراج اطلاعات، خلاصه‌سازی متون، ترجمه ماشینی و پرسش و پاسخ است. هدف از تحلیل هم ارجاعی شناسایی نامبری ها یا عباراتی در متن است که به یک موجودیت اشاره می-کنند. منظور از نامبری، ضمایر، عبارات اسمی و موجودیت های نامدار است. هرچند طی چهار دهه گذشته تحلیل هم ارجاعی همواره یک موضوع تحقیقاتی فعال بوده است، اما برای استفاده در کاربردهای درک متن و در زمینه شناسایی نامبری ها، شناسایی مراجع کاندید و شناسایی زنجیره های هم مرجع، دقت آن در حد قابل‌قبول نیست. یکی از دلایل دشواری این مسئله نیاز آن به منابع دانش مختلف ازجمله دانش لغوی، دانش نحوی، دانش جهانی، ساختار گفتمان و دانش معنایی است. به‌گونه‌ای که در یک متن ممکن است، هر یک از موارد هم ارجاعی نیازمند یک یا چند منبع دانش برای تحلیل باشد؛ همچنین، انتخاب مرجع مناسب برای نامبری های موجود در متن تابع قواعد مختلفی است که تطابق جنسیت، تعداد، ساختار رشته‌ای، معنایی و سایر پارامترهای هم ارجاعی را تضمین کند. در این رساله، با در نظر گرفتن این ویژگی ها در راستای افزایش دقت، بازخوانی و سایر اهداف تحلیل هم ارجاعی مسئله در قالب پارامترهای مؤثر در کارایی مدل شده است. برای این منظور، با به‌کارگیری جدیدترین روش های تعبیه واژگان، شبکه‌های عصبی بازگشتی و مکانیزم توجه، بازنمایش دنباله کلمات و ویژگی های آن ها استخراج شد. سپس با استفاده از بازنمایش منابع دانش، انتخاب دانش مناسب و اطلاعات خوشه ها و موجودیت ها، نامبری ها و مراجع کاندید موجود در متن با دقت بالا استخراج شدند. همچنین با استفاده از مدل رتبه بندی چندشاخصه مبتنی بر شبکه های عصبی پرسپترون و کوهونن مراجع کاندید رتبه بندی شده و زنجیره های هم ارجاعی استخراج شدند. طبق نتایج شبیه سازی روی پیکره انگلیسیCoNLL-2012 shared task و پیکره پزشکی i2b2، به ترتیب به Avg. F1 و 83/9 درصد و 97/3 درصد دست یافتیم. علاوه بر این، مقدار F1 در تشخیص موجودیت های نامدار روی پیکره English Gigaword به میزان 7/04 درصد بهبود داده شده است.
کلید واژه ها (نمایه ها):
#پردازش زبان طبیعی #تحلیل هم ارجاعی #شبکه عصبی بازگشتی #رتبه بندی چند شاخصه #منبع دانش.
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)