پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع دکتری > سال 1396
پدیدآورندگان:
مرضیه رحیمی [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، هدی مشایخی[استاد مشاور]
چکیده: در تحلیل داده‌های متنی، مدل‌سازی موضوعی آماری نقش بسیار جدی و پویایی را بازی می‌کند. زیرا در این حیطه، به دلیل اینکه متون بر اساس کلماتشان توصیف می‌شوند، با داده‌هایی با ابعاد بالا و تقریبا بی‌ساختار روبرو هستیم. بنابراین، ارائه مدلی موضوعی که داده‌های متنی را به جای کلمات، بر مبنای موضوعات توصیف ‌کند، می‌تواند ضمن کاهش ابعاد داده، وجوه معنادارتری از متون را نیز برجسته نماید. در ارائه چنین مدلی معمولاً مبنای تصمیم‌گیری، آمار همرخدادی کلمات در محدوده یک سند است. یکی از مشکلات بسیاری از مدل‌های موضوعی که مبتنی بر همرخدادی کلمات در محدوده یک سند هستند، عدم توانایی در بهره‌گیری از روابط محلی یا مکانی کلمات است. برخی از محققان سعی کرده‌اند با ترکیب مدل‌های موضوعی و مدل‌های زبانی موجود، این مشکل را حل نمایند. اما وارد کردن ترتیب دقیق کلمات، مشکل تنکی را با خود به همراه می‌آورد. از طرفی، در بسیاری از کاربردها، ترتیب کلمات نقش حیاتی بازی نمی‌کند. در این رساله، هدف ما طراحی مدلی است که بتواند از اطلاعات نسبی مکانی و ارتباطات محلی کلمات بهره برده و در عین حال، مشکل تنکی را برجسته ننماید. برای این منظور به‌جای تکیه بر ترتیب دقیق کلمات، از موقعیت نسبی آنها بهره‌گرفته‌ایم. یعنی برای هر کلمه از متن، پنجره‌ای بر روی کلمات اطرافش تصور شده است که از آن، برای کد کردن اطلاعات مربوط به موقعیت نسبی کلمات، بهره برده‌ایم. برای ارزیابی، از سه معیار پرپلکسیتی، انسجام و قابلیت مدل در کاربرد خوشه‌بندی، بر روی داده‌های واقعی استفاده کرده‌ایم. نتایج این آزمایشات، همچنین با برخی از مدل‌های مرتبط معرفی‌شده در سال‌های اخیر، مقایسه شده و بهبودهای چشمگیری را در هر سه معیار، نشان داده‌اند. مدل‌های پیشنهادی در بهترین حالت، قادرند موضوعاتی را تولید نمایند که نسبت به موضوعات تولیدشده توسط روش‌های موجود، 28% منسجم‌ترند.
کلید واژه ها (نمایه ها):
#مدل‌سازی موضوعی احتمالاتی #تحلیل متن #تخصیص پنهان دریکله #مدل‌های گرافیکی #نمونه‌برداری گیبس #مدل‌های مولد #ارتباطات محلی کلمات #همرخدادی

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)