پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1402
پدیدآورندگان:
مرتضی نوروزی [پدیدآور اصلی]، فاطمه جعفری نژاد[استاد راهنما]
چکیده: در این پایان‌نامه، مسئله تشخیص گفتمان ناپسند در شبکه‌های اجتماعی مورد بررسی قرار می‌گیرد. باتوجه‌به اهمیت ارتباطات آنلاین و نیاز به حفظ یک محیط سالم و متناسب با استانداردهای اخلاقی، هدف اصلی این تحقیق توسعه یک روش دقیق و کارآمد برای تشخیص پیام‌های گفتمانی ناپسند در شبکه‌های اجتماعی است. باتوجه‌به اهمیت و افزایش استفاده از گفتمان ناپسند، در پی رواج استفاده از شبکه های اجتماعی، تحقیقات متعددی برای شناسایی انواع گفتمان ناپسند در انواع زبان‌ها صورت‌گرفته است. در مورد زبان فارسی، باتوجه‌به اینکه به‌عنوان یک‌زبان کم منبع شناخته می شود، تحقیقات معدودی انجام شده است. در این پایان نامه بر آنیم تا به مسئله تشخیص اتوماتیک گفتمان ناپسند در زبان فارسی بپردازیم. دراین‌خصوص به خزش متون شبکه اجتماعی و برچسب‌گذاری و آماده‌سازی یک مجموعه‌دادگان پرداختیم. همچنین از برخی از دادگان موجود در زبان فارسی استفاده نمودیم. در زمینه مدل، باتوجه‌به کم منبع بودن زبان فارسی، به سراغ مدل‌های مبتنی بر یادگیری انتقالی (به طور خاص انتقال بین‌زبانی) و استفاده از منابع داده ای چندزبانه خواهیم پرداخت. با بهره گیری از یک مجموعه‌دادگان بزرگ گفتمان ناپسند در زبان انگلیسی، به معرفی سه معماری مبتنی بر یادگیری انتقالی خواهیم پرداخت. دو معماری، از روش‌های ترجمه بین‌زبانی بهره خواهند برد. معماری سوم نیز از مدل‌های زبانی چندزبانه مانند M-BERT و XLM استفاده خواهد نمود. نتایج به‌دست‌آمده از تست معماری‌های پیشنهادی حاکی از آن است که این روش‌ها نسبت به روش‌های دیگر مبتنی بر یادگیری ماشین و یادگیری عمیق (مانند شبکه های عصبی بازگشتی، شبکه های عصبی پیچشی و استفاده از مدل‌های زبانی تک‌زبانه مانند BERT فارسی) بادقت بالاتری (حدود ۵ تا ۱۰ درصد) به تشخیص گفتمان ناپسند می پردازد.
کلید واژه ها (نمایه ها):
#پردازش زبان طبیعی #یادگیری عمیق #یادگیری انتقالی #مدل‌های بین‌زبانی #تشخیص گفتمان ناپسند
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)