پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع دکتری > سال 1402
پدیدآورندگان:
مصطفی دیبا [پدیدآور اصلی]، حسین خسروی[استاد راهنما]
چکیده:
شناسایی چهره یکی از محبوب ترین روشها در حوزه احراز هویت زیستسنجی است و کاربردهای متنوعی در حوزههای مختلف نظامی، تجاری و احراز هویت عمومی در زندگی روزمره دارد. این موضوع همواره با چالشهای فراوانی همراه بوده است. با افزایش تعداد کلاسها به صدها کلاس امکان اینکه کلاسها با هم درآمیختگی داشته باشند خیلی بالا میرود و لذا شناسایی سختتر خواهد شد. برای حل مسائل پیچیده معماریهای عمیق پیشنهاد شده که عمق و عرض مدلها را افزایش میدهد. در معماریهای عمیق افزایش تعداد لایههای همگشت و همچنین افزایش تعداد فیلترها در هر لایه چالش افزونگی را به همراه دارد. این چالش باعث کاهش سرعت آموزش مدلها شده و برای آموزش مناسب، نیازمند پردازندههای گرافیکی گران قیمت است.
در این رساله راهکاری پیشنهاد می دهیم که بتوان ضمن حفظ دقت در حوزه شناسایی چهره، سرعت در هر دو مرحله آموزش و آزمایش را بهبود داد. برای رسیدن به این هدف، روشی را برای هرس شبکه های عمیق پیشنهاد دادیم که بوسیله آن بتوان فیلترهای غیرفعال در مدل را شناسایی و حذف کرد. این روش برای دو مدل تشخیص چهره با استفاده از معماری VGG16 و ResNet50V2 اعمال شد. در مدل تشخیص چهره مبتنی بر VGG16، دقت 74/0% افزایش یافت در حالی که تعداد پارامترهای همگشتی و عملیات ممیّز شناوردر ثانیه به ترتیب به میزان 85/26% و 96/47% کاهش پیدا کرد. برای مدل تشخیص چهره بر اساس معماری ResNet50V2، از تابع هزینه ArcFace استفاده کردیم. حذف فیلترهای غیر فعال در این مدل منجر به کاهش جزئی دقت تا 11/0% شد. با این حال، توانستیم به کاهش 38/59% در پارامترهای همگشتی و کاهش 29/57% در عملیات ممیّز شناور دست یابیم.
در این رساله، یک معماری جدید تشخیص چهره مبتنی بر معماری Inception-ResNet به نام SNResNet ارائه شده است. معماری Inception-ResNet مشکلاتی مانند پیچیدگی محاسباتی و مصرف بالای حافظه را دارد. این مدل از تابع فعالساز ReLU و تابع هزینه Softmax استفاده میکند. مدل SNResNet پیشنهادی از TripletLoss به عنوان تابع هزینه استفاده میکند تا بتواند روی مجموعه دادههای بزرگ آموزش ببیند. در این مدل به جای تابع فعالساز ReLU، یک تابع فعالساز جدید به نام Rish را معرفی کردیم که عملکرد بهتری دارد. علاوه بر این، بلوک های Inception-ResNet-B و Inception-ResNet-A را با استفاده از بلوک SqNxt برای کنترل هزینههای محاسباتی مدل بهبود دادیم. دقت مدل پیشنهادی در پایگاه داده معیار LFW 68/99% بدست آمد در حالی که دقت مدل استاندارد برابر با 85/98% است. پارامترهای همگشتی و FLOPS مدل پیشنهادی به ترتیب به میزان 56/15% و 61/15% نسبت به مدل استاندارد کمتر است که این امر بیانگر هزینه محاسباتی کمتر و یک مدل سریعتر برای تشخیص چهره است.
کلید واژه ها (نمایه ها):
#شناسایی چهره #هرس شبکه #یادگیری عمیق #Inception-ResNet #VGG 16 #تابع فعالساز #بلوک SqNxt
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: