پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1391
پدیدآورندگان:
محمد علیپور سراجی [پدیدآور اصلی]، علیرضا احمدی فرد[استاد راهنما]، امیدرضا معروضی[استاد مشاور]
چکیده: تشخیص خودکار متن یکی از زیر مجموعه های پردازش تصویر است که به طور گسترده در کتابخانه دیجیتال، خواندن آدرس پستی نامه ها، خواندن چک های بانکی، خواندن فرم ها و پرسشنامه ها استفاده می شود. بازشناسی متون دست نوشته فارسی در دو سطح کلی برون خط و بر خط انجام می پذیرد که سیستمهای برون خط خود به دو دسته تقسیم می شود: سیستمهای مبتنی بر جداسازی و سیستمهای کلی نگر.
در سیستمهای مبتنی بر جداسازی سعی می شود کلمات به زیر کلمات و حروف سازنده آن تقسیم شوند و از آنها برای شناسایی استفاده شود اما در سیستمهای کلینگر، ویژگیها مستقیما از تصویر کلی کلمه استخراج می شود و با مقایسه با داده های فرهنگ لغت، مشابه ترین کلمه به ورودی به عنوان خروجی در نظر گرفته میشود.
در این تحقیق روشی برای بازشناسی کلمات دستنوشته فارسی با استفاده از شکل کلی کلمه ارائه شده است. مراحل کار برای شناسایی کلمه شامل: پیش پردازش(باینری کردن، رفع شکستگی، حذف نویز) ،استخراج ویژگی(گرادیان، پروفایل) و طبقهبند (SVM،KNN ) است.
در مرحله پیش پردازش برای تخمین مکان خط کرسی، تغییراتی در روش هیستوگرام افقی انجام میشود. تشخیص خط کرسی به منظور جداسازی نقاط از بدنه اصلی و همچنین برای نرمال سازی اجزاء بدنه اصلی ضروری است. در نتیجه فرایند پیشنهادی، از تصویر هر کلمه دو تصویر، یکی تصویر بدنه اصلی و دیگری تصویر نقاط و علائم حاصل میشود. برای استخراج ویژگیهای کلمه در تصویر بدنه اصلی، پس از نرمال سازی جداگانه اجزای آن، از بلوکبندی تطبیقی و برای استخراج ویژگی از تصویر نقاط و علائم از بلوک بندی یکنواخت استفاده میکنیم. هر بلوک در تصاویر فوق توسط اندازه گرادیان در 32 جهت توصیف میشود.
نتایج حاصل با استفاده از طبقه بندهای k نزدیکترین همسایگی و ماشین بردار پشتیبان نشان دهنده بهبود در دقت بازشناسی روش ارائه شده است اما به علت پیش پردازشهای صورت گرفته، روش ارائه شده به زمان بیشتری نسبت به روشهای پیشین نیازمند است. با خوشه بندی نمونهها به منظور کاهش فرهنگ لغت نتیجه بهبود میابد. به منظور خوشهبندی نمونهها از ویژگیهای پروفایل و هیستوگرام افقی و الگوریتم isodata استفاده شده است.
کلید واژه ها (نمایه ها):
#بازشناسی کلمات دست نوشته فارسی #گرادیان محلی #بلوک بندی تطبیقی #جداسازی نقاط از کلمه #تخمین خط کرسی دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: