پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1392
پدیدآورندگان:
مهدی نیازی [پدیدآور اصلی]، حمید حسن پور[استاد راهنما]، بهروز مینایی [استاد مشاور]، علی سبطی [استاد مشاور]
چکیده:
در این پایان نامه از یادگیری تقویتی برای پیدا کردن یک سیاست مناسب جهت رفع مشکل موجود در بازی های امروزی که سطح سختی نامتناسب و عدم تطبیق پذیری بازی، با قابلیت های بازیکنان می باشد استفاده کرده ایم. عامل یادگیرنده بازی که از روش یادگیری تطبیقی Dyna بهره می برد با بکار بردن تابع عمل-ارزش و دریافت پاداش، شروع به درک محیط اطراف خود می کند و در ادامه، مبحث انتخاب و سازماندهی ویژگی ها، اعمال و پاداش (که در همه بازی ها وجود دارد) در ترکیب با متد یادگیری مطرح می گردد. عامل یادگیرنده، شروع به آموزش دیدن در مقابل عامل هوشمند دشمن (الگوریتم های برپایه قانون ) می کند و در بخش نتایج نشان خواهیم داد که عامل یادگیرنده برای انتخاب سیاست در بازی، می تواند به نسبت برخی روش های موجود عملکرد بهینه تری را از خود نشان دهد.
دو آزمایش مختلف برای اثبات بهینه بودن روش مطرح شده در این پایان نامه طراحی گردیده است. در آزمایش اول موضوع کارایی عامل یادگیرنده مد نظر است که نشان دهنده توانایی الگوریتم ارائه شده در اجرای بازی بصورت موفق می باشد. آزمایش دوم نیز مقایسه ای بین روش ارائه شده در این پایان نامه و یکی دیگر از روش های رایج در بازی ها، در مواجهه با وضعیت های جدید انجام خواهد داد.
کلید واژه ها (نمایه ها):
#یادگیری ماشین #یادگیری تقویتی #بازی های کامپیوتری #عامل های هوشمند #عامل های یادگیرنده دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: