پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1401
پدیدآورندگان:
مصطفی بلوچزهی شهبخش [پدیدآور اصلی]، حمید حسن پور[استاد راهنما]
چکیده: بزرگنمایی چهره، که بهعنوان توهم چهره نیز شناخته میشود، به تولید تصاویر چهره وضوح بالا از تصاویر چهره وضوح پایین اشاره دارد. بزرگنمایی چهره یک دامنه خاص از مسئله بزرگنمایی تصویر است. اکثر روشهای پیشرفته به بازیابی ساختار اصلی تصاویر چهره وضوح پایین توجه چندانی نمیکنند. از این رو در این تحقیق یک مدل هوش مصنوعی بر پایه شبکههای متخاصم مولد جهت تمرکز برروی جزئیات فرکانس بالا برای بازیابی هرچه بهتر اطلاعات سراسری و محلی در عمل بزرگنمایی تصاویر چهره پیشنهاد شده است. یکی از مهمترین مسائل در حفظ ساختار تصویر وضوح پایین استفاده مناسب از لبهها و جزئیات فرکانس بالای تصویر ورودی است. بههمین دلیل پیشپردازشهایی همچون الگوی دودویی محلی و ماسک غیرتیز جهت بهبود لبههای تصویر وضوح پایین و برجستهسازی ویژگیهای سراسری و محلی استفاده شدهاند. علاوهبراین در شبکه مولد پیشنهادی بلوکهای لبه، خود-توجهی و باقیمانده برای افزایش عملکرد شبکه در حفظ ساختار و استفاده ویژگیهای سراسری و محلی بهشیوهای موازی مورد استفاده قرارگرفتهاند. نتایج ارزیابیها نشان میدهد، روش پیشنهادی توانسته ساختار تصاویر چهره را بهتر از روشهای بزرگنمایی چهره موجود حفظ کند.
موضوع دیگر در هر روش بزرگنمایی چهره تولید تصاویر با کیفیت از لحاظ بصری است. تا حد زیادی این موضوع به استفاده از توابع خطای مناسب بستگی دارد. در این پایاننامه از پنج تابع خطای مختلف جهت ارزیابی تصاویر تولیدشده و آموزش شبکه مولد استفاده شده است. یک تابع خطای جدید به نام Frechet VGG Distance (FVD) جهت ایجاد تصاویر چهره واقعیتر و باکیفیتتر برمبنای ویژگیهای استخراج شده از مدل VGG-19 و فاصله Frechet پیشنهاد شده است، که فاصله بین ویژگیهای تصاویر چهره واقعی و بزرگنماییشده را به حداقل میرساند. همچنین تابع خطای لبه برای کاهش فاصله جزئیات فرکانس بالای تصویر تولیدشده و تصویر مرجع مورد استفاده قرار گرفته است. توابع خطای روشنایی، مربعات خطا و متخاصم نیز از جنبههای فاصله روشنایی، تفاوت پیکسلی و تفاوت در سطح ویژگیها تصاویر چهره تولیدشده و مرجع را مقایسه میکنند.
هدف نهایی از بزرگنمایی تصاویر چهره افزایش دقت شناسایی چهره است. روشهای بسیاری جهت بزرگنمایی چهره ارائه شدهاند اما عملکرد نامناسبی در شناسایی چهره دارند. دلیل اصلی آن عدم حفظ ساختار تصویر چهره و تولید جزئیات جعلی است. نتایج نشاندهنده عملکرد مناسب روش پیشنهادی در افزایش دقت در روشهای مختلف شناسایی چهره نسبت به بهترین روشهای بزرگنمایی است. همچنین نتایج بیانگر عملکرد مناسب روش پیشنهادی در تصاویر وضوح پایین در دنیای واقعی است.
کلید واژه ها (نمایه ها):
#بزرگنمایی تصویر چهره #یادگیری عمیق #شبکههای متخاصم مولد #حفظ ساختار چهره #شناسایی چهره
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: