پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع کارشناسی ارشد > سال 1403
پدیدآورندگان:
محمدرضا غلامیبرمی [پدیدآور اصلی]، حسین خسروی[استاد راهنما]
چکیده:
شناسایی ارقام با نگارشهای مختلف و در زمینههای گوناگون به یکی از موضوعات پرتقاضا در سالهای اخیر تبدیل شده است. این ارقام میتوانند در دستنوشتهها، متون ماشیننویس، پلاکهای منازل، دیوارنوشتهها، تابلوهای تبلیغاتی و پلاک خودروها مشاهده شوند. در حال حاضر، روشهای متعددی از جملهپردازش تصویر کلاسیک و یادگیری ماشین برای تشخیص و طبقهبندی اعداد به کار گرفته شدهاند. در این مطالعه قصد داریم ضمن بررسی روشهای قدیمی و نوین شناسایی اشیا و تمرکز بر الگوریتم یولو، ضمن آموزش نسخههای برتر این خانواده الگوریتم، با ایجاد تغییرات اندک در معماری مدل، برای شناسایی ارقام فارسی در تصاویر زمینه طبیعی شبکهای پیشنهاد دهیم که در عین حفظ دقت و سرعت سبکتر بوده و با حجم عمیات کمتر خروجی مطلوب را برای ما تولید نماید به عبارتی، هدف ما در این تحقیق، شناسایی ارقام دستنوشته و تایپی در تصاویر صحنههای طبیعی با استفاده از شبکههای عمیق مبتنی بر خانواده یولو است.
برای این منظور، ابتدا مجموعه دادهای شامل حدود 4000 تصویر از صحنههای طبیعی مختلف حاوی اعداد تایپی و دستنویس فارسی جمعآوری کرده و آنها را برچسبگذاری کردیم. سپس به کمک چند مدل منتخب از خانواده الگوریتم یولو، به شناسایی ارقام موجود در این تصاویر پرداختیم. مزیت اصلی این رویکرد، عدم نیاز به پردازشهای کلاسیک مانند ناحیهبندی تصویر یا سیاه و سفید کردن است؛ به طوری که شبکه عمیق پیشنهادی قادر است بهطور مستقیم و سریع ارقام را شناسایی کند. در گام بعد با درنظر گرفتن معیارهای اصلی، عملکرد نسخههای مختلف یولو در شناسایی اعداد فارسی از مجموعه داده مورد مطالعه را بررسی کردیم که نسخه هشتم الگوریتم یولو با دقت شناسایی 97% و معیار فراخوانی 98% در قیاس با نسخههای پیشین مورد آزمون در این پژوهش، از عملکرد بهتری برخوردار بود و به عنوان مدل برگزیده معرفی گردید. در نهایت با کاهش تعداد فیلترها در ساختار معماری مدل یولو8، به الگوریتم شناسایی سبکتری دست یافتیم که حجم محاسبات شبکه را از 6.8 GFlops در یولو8-نانو به 6.1 کاهش داد و با دقت شناسایی 98.8% و معیار فراخوانی 99% عملکرد بهتری نسبت به نسخه هشتم الگوریتم یولو از خود نشان داد.
کلید واژه ها (نمایه ها):
#شناسایی ارقام #تشخیص اشیا #تصاویر صحنههای طبیعی #یادگیری عمیق #شبکههای عصبی عمیق #الگوریتم یول
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: