پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1392
پدیدآورندگان:
زهرا ایمانی [پدیدآور اصلی]، علیرضا احمدی فرد[استاد راهنما]، حسین خسروی[استاد مشاور]
چکیده: در این پایان نامه سیستمی برای بازشناسی برون خط کلمات دست‎نویس فارسی ارائه شده است. پیچیدگی نگارش فارسی و شکل متفاوت حروف بسته به موقعیت آن که اول کلمه، وسط کلمه، انتهای کلمه یا جدا از بخش های دیگر کلمه باشد بازشناسی کلمات در این زبان را بسیار دشوار نموده است. بطوریکه درصد بازشناسی روش های موجود کمتر از نرخ مطلوب برای تجاری شدن این سیستم‎ها می باشد. یک سیستم بازشناسی کلمه در حالت کلی شامل مراحل پیش‎پردازش، استخراج ویژگی و کلاسه‎بندی است. در این پایان نامه سه روش جهت بازشناسی پیشنهاد شده و کارایی این روش ها در مقایسه با روش های موجود ارزیابی شده است. به دلیل نبود یک پایگاه داده مناسب و با تعداد تصویر کافی برای ارزیابی کارایی سیستم پیشنهادی، پایگاه داده فارسا، شامل 30000 تصویر از 300 کلمه متداول دست نوشته در زبان فارسی، ایجاد شد. جهت ارزیابی روش های پیشنهادی و مقایسه با روش های موجود 198 کلاس از این پایگاه داده مورد استفاده قرار گرفت. در روش اول تصویر کلمه به پنجره‎های عمودی دارای همپوشانی تقسیم می‎شود و از هر پنجره هیستوگرام کد‎های زنجیره‎ای استخراج می‎شود، هر پنجره یک بردار 20 عنصری را تولید می‎نماید. برای آموزش و ارزیابی HMM گسسته بردار ویژگی‎های استخراج شده از پنجره لغزان، با استفاده از شبکه عصبی نگاشت خود‎سازمانده کوانتیزه می‎شود . برای تعداد حالت‎های مخفی مدل HMMدر هر کلاس کلمه ، کمترین تعداد پنجره‎ برای تصاویر آموزش در هر کلاس بدست می‎آید. تعداد حالت‎های مخفی ضریبی از این مقدار کمینه است. با آزمایش ضرایب مختلف، سیستم در مقدار 8/1 به بهترین نرخ بازشناسی می‎رسد. برای پارامتر‎ هموارسازی روی مقادیر مختلف آزمایش شد، سیستم در مقدار 001/0 به جواب بهتری رسید. اندازه کتاب رمز 49 تنظیم می‎شود. در نهایت روش پیشنهادی اول با تعیین ضرایب بیان شده در بالا به نرخ بازشناسی 57/66% در198 کلاس از پایگاه داده فارسا می‎رسد. در روش پیشنهادی دوم علاوه بر هیستوگرام کد‎های زنجیره‎ای، از ویژگی میانگین بلوکی برای کلاسه‎بندی استفاده می‎شود و ابعاد بردارهای ویژگی به 25 افزایش می‎یابد. نرخ بازشناسی با استفاده از همان ضرایب تنظیم شده در روش اول، 88/68% بدست می‎آید. که افزایش بیش از 2% را نسبت به روش اول نشان ‎می‎دهد. روش پیشنهادی سوم در واقع بکارگیری یک سیستم دو خبره‎ای است. با استفاده از بررسی که روی نتایج ارزیابی روش دوم انجام شد یک مفهوم جدید به نام معیار اطمینان برای کلاسه‎بند HMM معرفی میشود. با مشاهده هیستوگرام اختلاف دو بزرگترین احتمال در خروجی HMM برای تصاویر آزمون یک مقدار آستانه به عنوان معیار اطمینان معرفی می‎شود. تصاویری که شرایط معیار اطمینان را دارند با کلاسه‎بند HMM بازشناسی می‎شوند و تصاویری که این شرایط را ندارند با استفاده از کلاسه‎بند KNN بازشناسی می‎شوند. برای کلاسه‎بند KNNاز ویژگی‎های ساختاری ، تعداد مولفه‎های متصل تصویر، تعداد مولفه‎های متصل بالای خط کرسی و تعداد مولفه‎های متصل پایین خط کرسی، استفاده می‎شود. کلاسه‎بند KNN با استفاده از این ویژگی‎ها و با 11 نزدیک‎ترین همسایه و معیار فاصله بلوک شهری به نرخ بازشناسی 69/61% دست می‎یابد. در این سیستم HMM برای تصاویری که معیار اطمینان را دارند به نرخ بازشناسی 85% دست می‎یابد. در کل نرخ بازشناسی این روش برای 198 کلاس از پایگاه داده فارسا 49/76% است. که نسبت به روش اول افزایش 7% را بدنبال دارد.
کلید واژه ها (نمایه ها):
#: بازشناسی کلمه دست‎نوشته فارسی #پایگاه داده فارسا #هیستوگرام کد‎های زنجیره‎ای #نگاشت خود‎سازمانده #مدل مخفی مارکوف #معیار اطمینان #k نزدیک ترین همسایه
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)