پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1393
پدیدآورندگان:
علی شهنما [پدیدآور اصلی]، علیرضا احمدی فرد[استاد راهنما]، حسین مروی[استاد راهنما]، مرتضی زاهدی[استاد مشاور]
چکیده: تخصیص نویسنده یکی از زیرشاخههای پردازش متن میباشد که هدف اصلی آن تعیین هویت نویسندهی یک متن است. به عبارت دیگر هدف اصلی این حوزه، طراحی سیستمی است که بتواند هویت نویسندهی یک متن را از میان چند نویسندهی نامزد تعیین نماید. به منظور طراحی چنین سیستمی میبایست تعدادی متن از هر نامزد در اختیار داشته باشیم.
تمامی پژوهشهای گذشته در حوزهی تخصیص نویسندهی متون فارسی به روشهای مبتنی بر سیستمهای پردازش زبانهای طبیعی (NLP) منحصر میشوند، اما هدف اصلی این پایاننامه بررسی عملکرد روشهایی موسوم به NDP بر روی مسائل تخصیص نویسندهی زبان فارسی است. این روشها بر مبنای تعداد تکرار انگرامها طراحی شده و کاملاً مستقل از سیستمهای NLP میباشند.
در این پایاننامه مهمترین روشهای NDP موجود مطالعه شده و سپس با الهام از آنها، دو روش جدید پیشنهاد شده است. در روش پیشنهادی اول (CNG-WIS) به جای استفاده از فرکانس انگرامها، اندیس آنها جهت حل مسائل به کار رفته است. در دومین روش پیشنهادی (VNG) به جای آنکه انگرامهای پرتکرار مبنای کار قرار گیرند، از انگرامهای پراکنده استفاده شده است.
به منظور ارزیابی روشهای موجود و همچنین مقایسهی روشهای پیشنهادی با آنها، از چهار مجموعهمتن (یا پایگاهداده) مختلف از دو زبان فارسی و عربی استفاده شده است. یکی از این مجموعهمتنها (به نام CPPT) توسط نگارنده گردآوری شده و دارای 145متن از 6 نویسندهی معاصر فارسیزبان میباشد. نتایج بدستآمده حاکی از آنست که علاوه بر روشهای NDP موجود، روشهای پیشنهادی نیز قدرت بالایی در حل مسائل تخصیص نویسندهی زبانهای فارسی و عربی دارند.
در انتها، دو مسئلهی خاصِ حوزهی ادبیات فارسی بررسی شدهاند: نظیرههای گلستان و غزلیات سبک هندی. بدینمنظور دو مجموعهمتن دیگر با نامهای GBP (شامل 75 حکایت از سه نویسنده) و SBH (شامل 90 غزل به سبک هندی از سه شاعر) توسط نگارنده جمعآوری شده است. نتایج بدستآمده نشان میدهد که روشهای NDP علاوه بر مسائل تخصیص نویسندهی متون نثر فارسی، در حکایات (ترکیبی از نثر و نظم) و اشعار نیز قدرت بالایی دارند.
کلید واژه ها (نمایه ها):
#تخصیص نویسنده #انگرام #روشهای مبتنی بر پروفایل #نشانگر سبک #مجموعهمتن CPPT #مجموعهمتن GBP و مجموعهمتن SBH. دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: