پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1391
پدیدآورندگان:
هادی تقی زاده [پدیدآور اصلی]، علیرضا احمدی فرد[استاد راهنما]، سید علی سلیمانی ایوری[استاد مشاور]
چکیده: در این تحقیق روشی برای تشخیص دستنوشته برخط فارسی مبتنی بر قطعهبندی زیر-کلمه به حروف و شناسایی حروف قطعهبندی شده با استفاده از مدل مخفی مارکوف گسسته ارائه شده است. تصویر متن تایپی یا دستنوشته به دلیل این که به صورت یکجا و بعد از نوشتن کامل آن در دسترس است برون خط نامیده میشود در حالی که دستنوشته دریافت شده توسط وسایل دیجیتال نظیر تبلت و تلفن همراه با صفحه لمسی به دلیل در دسترس بودن اطلاعات نوشته همزمان با عمل نوشتن، برخط نامیده میشود. برای تشخیص دستنوشته برون خط لازم است برای استخراج ویژگی از روشهای پردازش تصویر استفاده شود ولی ویژگیهای دستنوشته برخط مستقیماً از اطلاعات آن که شامل مختصات افقی و عمودی نقاط نوشته است استخراج میشود.
استخراج حروف در زیر-کلمه با قطعهبندی اضافی بر اساس زاویه نوشته با محور افقی انجام شده است و سپس با حذف موارد اشتباه طی چند مرحله، نقاط قطعهبندی نهایی مشخص میشوند. به دلیل وجود نقاط قطعهبندی اضافی، ترکیبهای مختلف قطعات امتیازبندی میشوند که این امتیازبندی بر حسب میانگین احتمال نرمالیزه شده رخداد توالی مشاهده قطعات آنها در مدل مخفی مارکوف است. سپس ترکیبهای دارای بالاترین امتیاز به عنوان کاندیدهای نهایی تشخیص گروه حروف معرفی میشوند، با استفاده از فرهنگ لغت متنی، گزینههای با گروه حروف مشابه پیدا میشود و گزینههایی که در فرهنگ لغت موجود نیستند حذف میشوند. در مرحله بعد گزینههایی که از نظر وجود علامت در بالا و پایین زیر-کلمه با زیر-کلمه ورودی منطبق نیستند حذف میشوند و در مرحله نهایی گزینههایی که تعداد حرکتهای زیر-کلمه در بالا و پایین آنها با زیر-کلمه ورودی مساوی نیست حذف میشوند.
صحت قطعهبندی با روش این تحقیق با استفاده از Ground Truth ساخته شده آزمایش شده است که 47/85 درصد نقاط قطعهبندی به درستی شناسایی شدهاند و 1/60 درصد نقاط اشتباه پیدا شده است. تشخیص زیر-کلمه با دقت 85/37 درصد انجام شده است که برای 10 گزینه اول بازشناسی به 34/73 درصد میرسد. این مقدار نسبت به کارهایی که با روش کلی نگر که کل زیر-کلمه را به عنوان الگوی شناسایی در نظر میگیرند و روی پایگاه داده تحقیق انجام شدهاند خیلی کمتر است که به دلیل ماهیت روش مبتنی بر قطعهبندی است که نیاز به قطعهبندی دقیق دارد اما کار مشابهی با همین پایگاه داده مبتنی بر تشخیص حروف وجود ندارد تا مقایسه انجام شود.
مزیت روش مبتنی بر قطعهبندی که در این تحقیق از آن استفاده شده، نسبت به روش کلینگر در این است که برای شناختن زیر-کلمات جدید کافی است که متن آنها به سیستم اضافه شود در حالی که روش کلینگر نیاز به نمونههای جدید دستنوشته دارد. مهمترین محدودیت این روش، عدم کارایی الگوریتمهای قطعهبندی است که خطای آن به مرحله تشخیص منتقل میشود و منجر به کاهش چشمگیر در نرخ شناسایی میشود.
کلمات کلیدی:
کلید واژه ها (نمایه ها):
#تشخیص دستنوشته برخط فارسی #قطعهبندی #مدل مخفی مارکوف دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: