پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1402
پدیدآورندگان:
مرتضی نوروزی [پدیدآور اصلی]، فاطمه جعفری نژاد[استاد راهنما]
چکیده:
در این پایاننامه، مسئله تشخیص گفتمان ناپسند در شبکههای اجتماعی مورد بررسی قرار میگیرد. باتوجهبه اهمیت ارتباطات آنلاین و نیاز به حفظ یک محیط سالم و متناسب با استانداردهای اخلاقی، هدف اصلی این تحقیق توسعه یک روش دقیق و کارآمد برای تشخیص پیامهای گفتمانی ناپسند در شبکههای اجتماعی است. باتوجهبه اهمیت و افزایش استفاده از گفتمان ناپسند، در پی رواج استفاده از شبکه های اجتماعی، تحقیقات متعددی برای شناسایی انواع گفتمان ناپسند در انواع زبانها صورتگرفته است. در مورد زبان فارسی، باتوجهبه اینکه بهعنوان یکزبان کم منبع شناخته می شود، تحقیقات معدودی انجام شده است.
در این پایان نامه بر آنیم تا به مسئله تشخیص اتوماتیک گفتمان ناپسند در زبان فارسی بپردازیم. دراینخصوص به خزش متون شبکه اجتماعی و برچسبگذاری و آمادهسازی یک مجموعهدادگان پرداختیم. همچنین از برخی از دادگان موجود در زبان فارسی استفاده نمودیم. در زمینه مدل، باتوجهبه کم منبع بودن زبان فارسی، به سراغ مدلهای مبتنی بر یادگیری انتقالی (به طور خاص انتقال بینزبانی) و استفاده از منابع داده ای چندزبانه خواهیم پرداخت. با بهره گیری از یک مجموعهدادگان بزرگ گفتمان ناپسند در زبان انگلیسی، به معرفی سه معماری مبتنی بر یادگیری انتقالی خواهیم پرداخت. دو معماری، از روشهای ترجمه بینزبانی بهره خواهند برد. معماری سوم نیز از مدلهای زبانی چندزبانه مانند M-BERT و XLM استفاده خواهد نمود. نتایج بهدستآمده از تست معماریهای پیشنهادی حاکی از آن است که این روشها نسبت به روشهای دیگر مبتنی بر یادگیری ماشین و یادگیری عمیق (مانند شبکه های عصبی بازگشتی، شبکه های عصبی پیچشی و استفاده از مدلهای زبانی تکزبانه مانند BERT فارسی) بادقت بالاتری (حدود ۵ تا ۱۰ درصد) به تشخیص گفتمان ناپسند می پردازد.
کلید واژه ها (نمایه ها):
#پردازش زبان طبیعی #یادگیری عمیق #یادگیری انتقالی #مدلهای بینزبانی #تشخیص گفتمان ناپسند
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: