پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1401
پدیدآورندگان:
مصطفی بلوچ‌‌زهی شه‌‌بخش [پدیدآور اصلی]، حمید حسن پور[استاد راهنما]
چکیده: بزرگنمایی چهره، که به‌عنوان توهم چهره نیز شناخته می‌شود، به تولید تصاویر چهره وضوح‌ بالا از تصاویر چهره وضوح پایین اشاره دارد. بزرگنمایی چهره یک دامنه خاص از مسئله بزرگنمایی تصویر است. اکثر روش‌های پیشرفته به بازیابی ساختار اصلی تصاویر چهره وضوح پایین توجه چندانی نمی‌کنند. از این رو در این تحقیق یک مدل هوش ‌مصنوعی بر پایه‌ شبکه‌های متخاصم مولد جهت تمرکز برروی جزئیات فرکانس بالا برای بازیابی هرچه بهتر اطلاعات سراسری و محلی در عمل بزرگنمایی تصاویر چهره پیشنهاد شده است. یکی از مهمترین مسائل در حفظ ساختار تصویر وضوح پایین استفاده مناسب از لبه‌ها و جزئیات فرکانس بالای تصویر ورودی است. به‌همین دلیل پیش‌پردازش‌هایی همچون الگوی دودویی محلی و ماسک غیرتیز جهت بهبود لبه‌های تصویر وضوح پایین و برجسته‌سازی ویژگی‌های سراسری و محلی استفاده شده‌اند. علاوه‌براین در شبکه مولد پیشنهادی بلوک‌های لبه، خود-توجهی و باقی‌مانده برای افزایش عملکرد شبکه در حفظ ساختار و استفاده ویژگی‌های سراسری و محلی به‌شیوه‌ای موازی مورد استفاده قرارگرفته‌اند. نتایج ارزیابی‌ها نشان می‌دهد، روش پیشنهادی توانسته ساختار تصاویر چهره را بهتر از روش‌های بزرگنمایی چهره موجود حفظ ‌کند. موضوع دیگر در هر روش بزرگنمایی چهره تولید تصاویر با کیفیت از لحاظ بصری است. تا حد زیادی این موضوع به استفاده از توابع خطای مناسب بستگی دارد. در این پایان‌نامه از پنج تابع خطای مختلف جهت ارزیابی تصاویر تولیدشده و آموزش شبکه مولد استفاده شده است. یک تابع خطای جدید به نام Frechet VGG Distance (FVD) جهت ایجاد تصاویر چهره واقعی‌تر و باکیفیت‌تر برمبنای ویژگی‌های استخراج شده از مدل VGG-19 و فاصله Frechet پیشنهاد شده است، که فاصله بین ویژگی‌های تصاویر چهره واقعی و بزرگنمایی‌شده را به حداقل می‌رساند. همچنین تابع خطای لبه برای کاهش فاصله‌ جزئیات فرکانس بالای تصویر تولیدشده و تصویر مرجع مورد استفاده قرار گرفته است. توابع خطای روشنایی، مربعات خطا و متخاصم نیز از جنبه‌های فاصله روشنایی، تفاوت پیکسلی و تفاوت در سطح ویژگی‌‌ها تصاویر چهره تولیدشده و مرجع را مقایسه می‌کنند. هدف نهایی از بزرگنمایی تصاویر چهره افزایش دقت شناسایی چهره است. روش‌های بسیاری جهت بزرگنمایی چهره ارائه شده‌اند اما عملکرد نامناسبی در شناسایی چهره دارند. دلیل اصلی آن عدم حفظ ساختار تصویر چهره و تولید جزئیات جعلی است. نتایج نشان‌دهنده عملکرد مناسب روش پیشنهادی در افزایش دقت در روش‌های مختلف شناسایی چهره نسبت به بهترین روش‌های بزرگنمایی است. همچنین نتایج بیانگر عملکرد مناسب روش پیشنهادی در تصاویر وضوح پایین در دنیای واقعی است.
کلید واژه ها (نمایه ها):
#بزرگنمایی تصویر چهره #یادگیری عمیق #شبکه‌های متخاصم مولد #حفظ ساختار چهره #شناسایی چهره
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)