پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1403
پدیدآورندگان:
محمدرضا غلامی‌برمی [پدیدآور اصلی]، حسین خسروی[استاد راهنما]
چکیده: شناسایی ارقام با نگارش‌های مختلف و در زمینه‌های گوناگون به یکی از موضوعات پرتقاضا در سال‌های اخیر تبدیل شده است. این ارقام می‌توانند در دست‌نوشته‌ها، متون ماشین‌نویس، پلاک‌های منازل، دیوارنوشته‌ها، تابلوهای تبلیغاتی و پلاک خودروها مشاهده شوند. در حال حاضر، روش‌های متعددی از جمله‌پردازش تصویر کلاسیک و یادگیری ماشین برای تشخیص و طبقه‌بندی اعداد به کار گرفته شده‌اند. در این مطالعه قصد داریم ضمن بررسی روش‌های قدیمی و نوین شناسایی اشیا و تمرکز بر الگوریتم یولو، ضمن آموزش نسخه‌های برتر این خانواده الگوریتم، با ایجاد تغییرات اندک در معماری مدل، برای شناسایی ارقام فارسی در تصاویر زمینه طبیعی شبکه‌ای پیشنهاد دهیم که در عین حفظ دقت و سرعت سبک‌تر بوده و با حجم عمیات کمتر خروجی مطلوب را برای ما تولید نماید به عبارتی، هدف ما در این تحقیق، شناسایی ارقام دست‌نوشته و تایپی در تصاویر صحنه‌های طبیعی با استفاده از شبکه‌های عمیق مبتنی بر خانواده یولو است. برای این منظور، ابتدا مجموعه داده‌ای شامل حدود 4000 تصویر از صحنه‌های طبیعی مختلف حاوی اعداد تایپی و دست‌نویس فارسی جمع‌آوری کرده و آن‌ها را برچسب‌گذاری کردیم. سپس به کمک چند مدل منتخب از خانواده الگوریتم یولو، به شناسایی ارقام موجود در این تصاویر پرداختیم. مزیت اصلی این رویکرد، عدم نیاز به پردازش‌های کلاسیک مانند ناحیه‌بندی تصویر یا سیاه و سفید کردن است؛ به طوری که شبکه عمیق پیشنهادی قادر است به‌طور مستقیم و سریع ارقام را شناسایی کند. در گام بعد با درنظر گرفتن معیارهای اصلی، عملکرد نسخه‌های مختلف یولو در شناسایی اعداد فارسی از مجموعه داده مورد مطالعه را بررسی کردیم که نسخه هشتم الگوریتم یولو با دقت شناسایی 97% و معیار فراخوانی 98% در قیاس با نسخه‌های پیشین مورد آزمون در این پژوهش، از عملکرد بهتری برخوردار بود و به عنوان مدل برگزیده معرفی گردید. در نهایت با کاهش تعداد فیلترها در ساختار معماری مدل یولو8، به الگوریتم شناسایی سبک‌تری دست یافتیم که حجم محاسبات شبکه را از 6.8 GFlops در یولو8-نانو به 6.1 کاهش داد و با دقت شناسایی 98.8% و معیار فراخوانی 99% عملکرد بهتری نسبت به نسخه هشتم الگوریتم یولو از خود نشان داد.
کلید واژه ها (نمایه ها):
#شناسایی ارقام #تشخیص اشیا #تصاویر صحنه‌های طبیعی #یادگیری عمیق #شبکه‌های عصبی عمیق #الگوریتم یول
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)