پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1402
پدیدآورندگان:
مرتضی خسروی [پدیدآور اصلی]، منصور فاتح[استاد راهنما]، مرتضی زاهدی[استاد راهنما]
چکیده:
یکی از شاخههای مهم علم هوش مصنوعی، بینایی ماشین و به خصوص تشخیص و بخشبندی اشیاء میباشد که کاربردهای گستردهای در صنایع و زندگی روزمره دارد. یکی از کاربردهای مهم بخشبندی، بخشبندی نمونهای تصاویر در محیطهای شهری است که در خودروهای خودران، تشخیص ترافیک و غیره استفاده میشود. با پیشرفتهای اخیر در علم هوش مصنوعی به خصوص یادگیری عمیق، روشهای دقیق و با قابلیت اطمینان بالا معرفی شدهاند که تولید سامانههای هوشمند هدایت خودرو و تشخیص اشیاء را ممکن ساختهاند. در این تحقیق میخواهیم دقت بخشبندی نمونهای انسان در تصاویر محیطهای شهری را بالا ببریم. یکی از چالشهای روشهای مبتنیبر یادگیری عمیق نیاز به دادههای فراوان برای یادگیری مناسب است. در مسئله بخشبندی نمونهای تصاویر به صورت پیکسلی بخشبندی شوند، از این رو، هزینه تولید برچسب برای تصاویر بالا است. برای کاهش هزینهها، دادههای جدیدی بر مبنای دادههای برچسبدار فعلی ساخته میشود تا تعداد نمونههای آموزش افزایش یابد. در این تحقیق، برای این منظور یک چارچوب منعطف تعریف شده که تصویر انسان را از یک تصویر کپی کرده و برروی تصویر دیگری قرار میدهد. وظیفه تعیین محل قرارگیری در تصویر مقصد بر عهده یک شبکه تخاصمی بر مبنای یادگیری تقویتی است. یک معماری رمزگذار به کمک الگوریتم A2C در حوزه معنایی محلهای مناسب پیشنهاد میدهد و یک معماری منتقد مشخص میکند تصویر مقصد پس از قرارگیری چقدر واقعی است. پس از آنکه محل قرارگیری مشخص شد، باید تصویر نهایی واقعگرایانه باشد. برای این منظور از معماری WGAN-GP استفاده شده است که تصویر انسان را در محل تعیین شده طوری قرار میدهد که از تصاویر واقعی قابل تشخیص نباشد. بدینترتیب توانستیم تصاویر جدید تولید کنیم و دقت بخشبندی نمونهای انسان توسط Mask R-CNN را بر روی دادگان Cityscapes به میزان 1/2% افزایش دهیم.
کلید واژه ها (نمایه ها):
#یادگیری عمیق #شبکه مولد متخاصم #یادگیری تقویتی
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: