پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1393
پدیدآورندگان:
علی شهنما [پدیدآور اصلی]، علیرضا احمدی فرد[استاد راهنما]، حسین مروی[استاد راهنما]، مرتضی زاهدی[استاد مشاور]
چکیده: تخصیص نویسنده یکی از زیرشاخه‌های پردازش متن می‌باشد که هدف اصلی آن تعیین هویت نویسنده‌ی یک متن است. به عبارت دیگر هدف اصلی این حوزه، طراحی سیستمی است که بتواند هویت نویسنده‌ی یک متن را از میان چند نویسنده‌ی نامزد تعیین نماید. به منظور طراحی چنین سیستمی می‌بایست تعدادی متن از هر نامزد در اختیار داشته باشیم. تمامی پژوهش‌های گذشته‌ در حوزه‌ی تخصیص نویسنده‌ی متون فارسی به روش‌های مبتنی بر سیستم‌های پردازش زبان‌های طبیعی (NLP) منحصر می‌شوند، اما هدف اصلی این پایان‌نامه بررسی عملکرد روش‌هایی موسوم به NDP بر روی مسائل تخصیص نویسنده‌ی زبان فارسی است. این روش‌ها بر مبنای تعداد تکرار انگرام‌ها طراحی شده و کاملاً مستقل از سیستم‌های NLP می‌باشند. در این پایان‌نامه مهم‌ترین روش‌های NDP موجود مطالعه شده و سپس با الهام از آن‌ها، دو روش جدید پیشنهاد شده است. در روش پیشنهادی اول (CNG-WIS) به جای استفاده از فرکانس انگرام‌ها، اندیس آن‌ها جهت حل مسائل به کار رفته است. در دومین روش پیشنهادی (VNG) به جای آنکه انگرام‌های پرتکرار مبنای کار قرار گیرند، از انگرام‌های پراکنده استفاده شده است. به منظور ارزیابی روش‌های موجود و هم‌چنین مقایسه‌ی روش‌های پیشنهادی با آن‌ها، از چهار مجموعه‌متن (یا پایگاه‌داده) مختلف از دو زبان فارسی و عربی استفاده شده است. یکی از این مجموعه‌متن‌ها (به نام CPPT) توسط نگارنده گردآوری شده و دارای 145متن از 6 نویسنده‌ی معاصر فارسی‌زبان می‌باشد. نتایج بدست‌آمده حاکی از آنست که علاوه بر روش‌های NDP موجود، روش‌های پیشنهادی نیز قدرت بالایی در حل مسائل تخصیص نویسنده‌ی زبان‌های فارسی و عربی دارند. در انتها، دو مسئله‌ی خاصِ حوزه‌ی ادبیات فارسی بررسی شده‌اند: نظیره‌های گلستان و غزلیات سبک هندی. بدین‌منظور دو مجموعه‌متن دیگر با نام‌های GBP (شامل 75 حکایت از سه نویسنده) و SBH (شامل 90 غزل به سبک هندی از سه شاعر) توسط نگارنده جمع‌آوری شده است. نتایج بدست‌آمده نشان می‌دهد که روش‌های NDP علاوه بر مسائل تخصیص نویسنده‌ی متون نثر فارسی، در حکایات (ترکیبی از نثر و نظم) و اشعار نیز قدرت بالایی دارند.
کلید واژه ها (نمایه ها):
#تخصیص نویسنده #انگرام #روش‌های مبتنی بر پروفایل #نشانگر سبک #مجموعه‌متن CPPT #مجموعه‌متن GBP و مجموعه‌متن SBH.
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)