پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق و رباتیک > مقطع کارشناسی ارشد > سال 1391
پدیدآورندگان:
هادی تقی زاده [پدیدآور اصلی]، علیرضا احمدی فرد[استاد راهنما]، سید علی سلیمانی ایوری[استاد مشاور]
چکیده: در این تحقیق روشی برای تشخیص دستنوشته برخط فارسی مبتنی بر قطعه‌بندی زیر-کلمه به حروف و شناسایی حروف قطعه‌بندی شده با استفاده از مدل مخفی مارکوف گسسته ارائه شده است. تصویر متن تایپی یا دستنوشته به دلیل این که به صورت یکجا و بعد از نوشتن کامل آن در دسترس است برون خط نامیده می‌شود در حالی که دستنوشته دریافت شده توسط وسایل دیجیتال نظیر تبلت و تلفن همراه با صفحه لمسی به دلیل در دسترس بودن اطلاعات نوشته همزمان با عمل نوشتن، برخط نامیده می‌شود. برای تشخیص دستنوشته برون خط لازم است برای استخراج ویژگی از روش‌های پردازش تصویر استفاده شود ولی ویژگی‌های دستنوشته برخط مستقیماً از اطلاعات آن که شامل مختصات افقی و عمودی نقاط نوشته است استخراج می‌شود. استخراج حروف در زیر-کلمه با قطعه‌بندی اضافی بر اساس زاویه نوشته با محور افقی انجام شده است و سپس با حذف موارد اشتباه طی چند مرحله، نقاط قطعه‌بندی نهایی مشخص می‌شوند. به دلیل وجود نقاط قطعه‌بندی اضافی، ترکیب‌های مختلف قطعات امتیازبندی می‌شوند که این امتیازبندی بر حسب میانگین احتمال نرمالیزه شده رخداد توالی مشاهده قطعات آن‌ها در مدل مخفی مارکوف است. سپس ترکیب‌های دارای بالاترین امتیاز به عنوان کاندیدهای نهایی تشخیص گروه حروف معرفی می‌شوند، با استفاده از فرهنگ لغت متنی، گزینه‌های با گروه حروف مشابه پیدا می‌شود و گزینه‌هایی که در فرهنگ لغت موجود نیستند حذف می‌شوند. در مرحله بعد گزینه‌هایی که از نظر وجود علامت در بالا و پایین زیر-کلمه با زیر-کلمه ورودی منطبق نیستند حذف می‌شوند و در مرحله نهایی گزینه‌هایی که تعداد حرکت‌های زیر-کلمه در بالا و پایین آن‌ها با زیر-کلمه ورودی مساوی نیست حذف می‌شوند. صحت قطعه‌بندی با روش این تحقیق با استفاده از Ground Truth ساخته شده آزمایش شده است که 47/85 درصد نقاط قطعه‌بندی به درستی شناسایی شده‌اند و 1/60 درصد نقاط اشتباه پیدا شده است. تشخیص زیر-کلمه با دقت 85/37 درصد انجام شده است که برای 10 گزینه اول بازشناسی به 34/73 درصد می‌رسد. این مقدار نسبت به کارهایی که با روش کلی نگر که کل زیر-کلمه را به عنوان الگوی شناسایی در نظر می‌گیرند و روی پایگاه داده تحقیق انجام شده‌اند خیلی کمتر است که به دلیل ماهیت روش مبتنی بر قطعه‌بندی است که نیاز به قطعه‌بندی دقیق دارد اما کار مشابهی با همین پایگاه داده مبتنی بر تشخیص حروف وجود ندارد تا مقایسه انجام شود. مزیت روش مبتنی بر قطعه‌بندی که در این تحقیق از آن استفاده شده، نسبت به روش کلی‌نگر در این است که برای شناختن زیر-کلمات جدید کافی است که متن آن‌ها به سیستم اضافه شود در حالی که روش کلی‌نگر نیاز به نمونه‌های جدید دستنوشته دارد. مهم‌ترین محدودیت این روش، عدم کارایی الگوریتم‌های قطعه‌بندی است که خطای آن به مرحله تشخیص منتقل می‌شود و منجر به کاهش چشمگیر در نرخ شناسایی می‌شود. کلمات کلیدی:
کلید واژه ها (نمایه ها):
#تشخیص دستنوشته برخط فارسی #قطعه‌بندی #مدل مخفی مارکوف
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)