پایانامه های دانشگاه صنعتی شاهرود

TK754: تشخیص و کنترل تحمل‌پذیر خطا برای سیستم‌های دینامیکی به کمک یادگیری تقویتی

پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع دکتری > سال 1398

پدیدآورندگان:

امین نوری [پدیدآور اصلی]، محمد علی صدرنیا[استاد راهنما]، محمدباقر نقیبی سیستانی [استاد مشاور]

چکیده: این رساله به کنترل تحمل‌پذیر عیب با استفاده از روش‌های یادگیری تقویتی می‌پردازد. کنترل تحمل‌پذیر عیب با استفاده از یادگیری تقویتی از چند جنبه مورد بحث و بررسی قرار می‌گیرد. در ابتدا، به خاصیت رفتاری مقاوم بودن الگوریتم یادگیری تقویتی اشاره می‌شود و اینکه به صورت ذاتی قابلیت تحمل‌پذیری عیب را تا حدودی دارا می‌باشد. در ادامه، با شناسایی سیستم سالم و بدون عیب به کمک شبکه‌های عصبی توابع پایه شعاعی، مانده محاسبه می‌شود. اولین نوآوری این رساله ترکیب الگوریتم مسیرهای شایستگی -که یکی از کارآمدترین روش‌های یادگیری تقویتی می‌باشد- و کنترل‌کننده مد لغزشی، جهت کنترل تحمل‌پذیر عیب می‌باشد. ساختار پیشنهادی با ساختارهای پیشین که مبتنی بر ترکیب شبکه عصبی و کنترل‌کننده مد لغزشی می‌باشد، مقایسه می‌گردد و رفتار بهتر ساختار پیشنهادی مطرح می‌گردد. در دومین نوآوری رساله، ابتدا دامنه و نوع عیب به کمک پنجره زمانی محاسبه می‌گردد و از این داده‌ها به همراه حالت‌های سیستم و خطای دریافتی، کنترل تحمل‌پذیر عیب با استفاده از روش مسیرهای شایستگی انجام می‌شود. در انتها نشان داده می‌شود که این ساختار با وجود سادگی، رفتار بسیار بهتری را در کنترل تحمل پذیر عیب دارا می‌باشد. جهت بررسی رفتاری کنترل تحمل‌پذیر عیب با توجه به ساختار پیشنهادی، روش مسیرهای شایستگی با روش‌های پایه یادگیری تفاوت گذرا همانند یادگیری-Q و سارسا مقایسه می‌شود. در آخرین نوآوری رساله، با استفاده از شبکه‌های عصبی مصنوعی پیشرو، سیستم سالم و بدون عیب شناسایی می‌گردد و بر اساس آن مانده محاسبه ‌می‌شود. با استفاده از مانده بدست آمده و الگوریتم یادگیری تقویتی پیوسته و ترکیب آن با الگوریتم گام خودکار، کنترل تحمل‌پذیر عیب صورت می‌گیرد. روش‌های پیشنهادی در این رساله بر روی دو سیستم بیماری دیابت و سرطان ملانوما که نوعی سرطان پوست می‌باشد شبیه‌سازی گردیده است. بی‌نیاز بودن به مدل محیط، یکی از مهمترین مزایای الگوریتم‌های یادگیری تقویتی در کنترل سیستم‌ها می‌باشد. ولی از آنجا که مدل واقعی (بیمار) در دسترس نمی‌باشد جهت بررسی ساختارهای پیشنهادی برای کنترل تحمل‌پذیر عیب، از مدل ریاضی سیستم بیماری دیابت و سرطان ملانوما استفاده می‌شود. در درمان سرطان ملانوما در حضور عیب، نیمه عمر دارو هم لحاظ گردیده است که در مسایلی که هدف تعیین دوز بهینه دارو می‌باشد بسیار مهم می‌باشد منتهی در کارهای بسیار کمی این مورد لحاظ گردیده است.

کلید واژه ها (نمایه ها):

#کنترل تحمل‌پذیر عیب #یادگیری تقویتی #مسیرهای شایستگی #شبکه‌های عصبی مصنوعی #یادگیری-Q

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:

پایان نامه های مرتبط (بر اساس کلیدواژه ها)

دانشگاه صنعتی شاهرود
Shahrood University of
Technology

دسترسی سریع

وبگاه‌ها