پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1393
پدیدآورندگان:
زهرا رباطی [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]، مرضیه رحیمی[استاد مشاور]
چکیده: با توجه به رشد روزافزون متون الکترونیکی و از جمله متون خبری، معرفی یک دسته بند کارآمد در بسیاری از برنامه های کاربردی مرتبط با متون از جمله وبسایت های خبری، اهمیت بیشتری یافته است. از مهم ترین مسائل دامنه ی دسته بندی متون، استخراج ویژگی های کارا برای دسته بندی است. در کارهای گذشته معیارهای ارزش گذاری ویژگی متفاوتی ارائه شده و مورد استفاده قرار گرفته اند. در این پایان نامه نیز یک معیار ارزش گذاری ویژگی بنام E-Dominace ارائه شده است که با استفاده از آن، کاهش چشمگیری در تعداد ویژگی های انتخابی رخ می دهد. ویژگی های به کار رفته در این دسته بندی، ویژگی های همرخداد هستند که تابه حال در دسته بندی متون فارسی مورد استفاده قرار نگرفته اند.
در کارهایی که در زبان انگلیسی با استفاده از ویژگی های همرخداد انجام شده اند، روش وزن-دهی باینری به کار گرفته شده اند. در این پایان نامه با توسعه ی روش وزن دهی TFIDF ، یک روش وزن دهی برای ویژگی های همرخداد به نام Co-occur TFIDF معرفی و به کار گرفته شده است که دقت بهتری را در مقایسه با وزن دهی باینری نشان می دهد. ویژگی های توسعه گر نیز برای کم کردن اثر همپوشانی کلاس ها و توسعه ی متون، در این تحقیق به کار گرفته شده اند. نتایج آزمایشات، نشان دهنده ی بهبود قابل توجهی در کارایی و دقت الگوریتم دسته بندی با بکارگیری معیار E-Dominance و استفاده از ویژگی های همرخداد با روش وزن دهی Co-occur TFIDF است.
کلید واژه ها (نمایه ها):
#دسته بندی متون فارسی #انتخاب ویژگی #استخراج ویژگی #معیار E-Dominance #ویژگی های همرخداد #ویژگی های توسعه گر #وزن دهی Co-occur TFIDF. دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: