پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > پردیس خوارزمی و آموزش های الکترونیکی > مقطع کارشناسی ارشد > سال 1395
پدیدآورندگان:
سمانه وزیریان [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، حمید حسن پور[استاد مشاور]
چکیده: شناسایی نویسنده یکی از زیر شاخه های پردازش متن است و هدف آن مشخص کردن نویسنده یک متن با نویسنده ناشناس است که با عنوان متن دیده نشده از آن یاد می شود. انتخاب نویسنده برای متن دیده نشده، از میان مجموعه ای از نویسنده گان با عنوان نویسنده گان کاندید، انجام می گیرد. برای طراحی سیستم شناسایی نویسنده نیاز به ویژگی های مشخص کننده سبک، و انتخاب روش برای طبقه بندی و یا تخصیص نویسنده مناسب برای متن دیده نشده است. معمولا انتخاب ویژگی از میان داده های آموزشی موجود برای هر نویسنده کاندید صورت می گیرد. با افزایش روند تولید متن در زبان های مختلف نیاز به توسعه سیستم های تشخیص نویسنده که مستقل از زبان نگارش متن عمل نمایند ضروری به نظر می رسد. در این پایان نامه برای حل مسئله تشخیص نویسنده از n-گرام کارکتر ها و n-گرام کلمات به عنوان ویژگی ها با مزیت استخراج آسان و مستقل از زبان، استفاده شده است. و به عنوان یک روش آماری و احتمالاتی مدل سازی زبانی به عنوان روش تخصیص استفاده شده است. برای بهبود نتایج ترکیب 1-گرام کلمات با 2-گرام کلمات همراه با مقدار IDF به عنوان وزن دهی احتمال n-گرام ها با عنوان مدل سازی زبانی تغییر یافته پیشنهاد شده است. همچنین عوامل موثر بر نتیجه ارزیابی مانند کاهش داده آموزشی و افزایش تعداد نویسنده کاندید و متعادل بودن یا نا متعادل بودن داده آموزشی در حل مسئله تشخیص نویسنده بررسی شده است. برای ارزیابی از چهار پایگاه داده استفاده شده است. سه پایگاه داده در زبان فارسی و پایگاه داده چهارم در زبان انگلیسی است. روش مدل سازی تغییر یافته در تمام آزمایشات انجام شده بهبود را نسبت به n-گرام کاراکتر ها وn -گرام کلمات نشان می دهد. بهترین نتیجه با رسیدن به دقت100% با مدل سازی تغییر یافته در پایگاه داده فارسی بهبود خوبی را در استفاده از n-گرام ها نشان می دهد.
کلید واژه ها (نمایه ها):
#شناسایی نویسنده #تخصیص نویسنده #انگرام #مدل سازی زبانی #پایگاه داده WMPR-AA2016-A #پایگاه داده .WMPR-AA2016-B

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)