پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع دکتری > سال 1402
پدیدآورندگان:
مصطفی دیبا [پدیدآور اصلی]، حسین خسروی[استاد راهنما]
چکیده: شناسایی چهره یکی از محبوب ترین روش‌ها در حوزه احراز هویت زیست‎سنجی است و کاربردهای متنوعی در حوزه‌های مختلف نظامی، تجاری و احراز هویت عمومی در زندگی روزمره دارد. این موضوع همواره با چالش‌های فراوانی همراه بوده است. با افزایش تعداد کلاس‌ها به صدها کلاس امکان اینکه کلاس‌ها با هم درآمیختگی داشته باشند خیلی بالا می‌رود و لذا شناسایی سخت‌تر خواهد شد. برای حل مسائل پیچیده معماری‌های عمیق پیشنهاد شده که عمق و عرض مدل‌ها را افزایش می‌دهد. در معماری‌های عمیق افزایش تعداد لایه‌های همگشت و همچنین افزایش تعداد فیلترها در هر لایه چالش افزونگی را به همراه دارد. این چالش باعث کاهش سرعت آموزش مدل‌ها شده و برای آموزش مناسب، نیازمند پردازنده‌های گرافیکی گران قیمت است. در این رساله راهکاری پیشنهاد می دهیم که بتوان ضمن حفظ دقت در حوزه شناسایی چهره، سرعت در هر دو مرحله آموزش و آزمایش را بهبود داد. برای رسیدن به این هدف، روشی را برای هرس شبکه های عمیق پیشنهاد دادیم که بوسیله آن بتوان فیلترهای غیرفعال در مدل را شناسایی و حذف کرد. این روش برای دو مدل تشخیص چهره با استفاده از معماری VGG16 و ResNet50V2 اعمال شد. در مدل تشخیص چهره مبتنی بر VGG16، دقت 74/0% افزایش یافت در حالی که تعداد پارامترهای همگشتی و عملیات ممیّز شناوردر ثانیه به ترتیب به میزان 85/26% و 96/47% کاهش پیدا کرد. برای مدل تشخیص چهره بر اساس معماری ResNet50V2، از تابع هزینه ArcFace استفاده کردیم. حذف فیلترهای غیر فعال در این مدل منجر به کاهش جزئی دقت تا 11/0% شد. با این حال، توانستیم به کاهش 38/59% در پارامترهای همگشتی و کاهش 29/57% در عملیات ممیّز شناور دست یابیم. در این رساله، یک معماری جدید تشخیص چهره مبتنی بر معماری Inception-ResNet به نام SNResNet ارائه شده است. معماری Inception-ResNet مشکلاتی مانند پیچیدگی محاسباتی و مصرف بالای حافظه را دارد. این مدل از تابع فعال‌ساز ReLU و تابع هزینه Softmax استفاده می‌کند. مدل SNResNet پیشنهادی از TripletLoss به عنوان تابع هزینه استفاده می‌کند تا بتواند روی مجموعه داده‌های بزرگ آموزش ببیند. در این مدل به جای تابع فعال‌ساز ReLU، یک تابع فعال‌ساز جدید به نام Rish را معرفی کردیم که عملکرد بهتری دارد. علاوه بر این، بلوک های Inception-ResNet-B و Inception-ResNet-A را با استفاده از بلوک SqNxt برای کنترل هزینه‌های محاسباتی مدل بهبود دادیم. دقت مدل پیشنهادی در پایگاه داده معیار LFW 68/99% بدست آمد در حالی که دقت مدل استاندارد برابر با 85/98% است. پارامترهای همگشتی و FLOPS مدل پیشنهادی به ترتیب به میزان 56/15% و 61/15% نسبت به مدل استاندارد کمتر است که این امر بیانگر هزینه محاسباتی کمتر و یک مدل سریع‌تر برای تشخیص چهره است.
کلید واژه ها (نمایه ها):
#شناسایی چهره #هرس شبکه #یادگیری عمیق #Inception-ResNet #VGG 16 #تابع فعال‌ساز #بلوک SqNxt 
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)