پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی برق > مقطع دکتری > سال 1398
پدیدآورندگان:
امین نوری [پدیدآور اصلی]، محمد علی صدرنیا[استاد راهنما]، محمدباقر نقیبی سیستانی [استاد مشاور]
چکیده: این رساله به کنترل تحملپذیر عیب با استفاده از روشهای یادگیری تقویتی میپردازد. کنترل تحملپذیر عیب با استفاده از یادگیری تقویتی از چند جنبه مورد بحث و بررسی قرار میگیرد. در ابتدا، به خاصیت رفتاری مقاوم بودن الگوریتم یادگیری تقویتی اشاره میشود و اینکه به صورت ذاتی قابلیت تحملپذیری عیب را تا حدودی دارا میباشد. در ادامه، با شناسایی سیستم سالم و بدون عیب به کمک شبکههای عصبی توابع پایه شعاعی، مانده محاسبه میشود. اولین نوآوری این رساله ترکیب الگوریتم مسیرهای شایستگی -که یکی از کارآمدترین روشهای یادگیری تقویتی میباشد- و کنترلکننده مد لغزشی، جهت کنترل تحملپذیر عیب میباشد. ساختار پیشنهادی با ساختارهای پیشین که مبتنی بر ترکیب شبکه عصبی و کنترلکننده مد لغزشی میباشد، مقایسه میگردد و رفتار بهتر ساختار پیشنهادی مطرح میگردد. در دومین نوآوری رساله، ابتدا دامنه و نوع عیب به کمک پنجره زمانی محاسبه میگردد و از این دادهها به همراه حالتهای سیستم و خطای دریافتی، کنترل تحملپذیر عیب با استفاده از روش مسیرهای شایستگی انجام میشود. در انتها نشان داده میشود که این ساختار با وجود سادگی، رفتار بسیار بهتری را در کنترل تحمل پذیر عیب دارا میباشد. جهت بررسی رفتاری کنترل تحملپذیر عیب با توجه به ساختار پیشنهادی، روش مسیرهای شایستگی با روشهای پایه یادگیری تفاوت گذرا همانند یادگیری-Q و سارسا مقایسه میشود. در آخرین نوآوری رساله، با استفاده از شبکههای عصبی مصنوعی پیشرو، سیستم سالم و بدون عیب شناسایی میگردد و بر اساس آن مانده محاسبه میشود. با استفاده از مانده بدست آمده و الگوریتم یادگیری تقویتی پیوسته و ترکیب آن با الگوریتم گام خودکار، کنترل تحملپذیر عیب صورت میگیرد. روشهای پیشنهادی در این رساله بر روی دو سیستم بیماری دیابت و سرطان ملانوما که نوعی سرطان پوست میباشد شبیهسازی گردیده است. بینیاز بودن به مدل محیط، یکی از مهمترین مزایای الگوریتمهای یادگیری تقویتی در کنترل سیستمها میباشد. ولی از آنجا که مدل واقعی (بیمار) در دسترس نمیباشد جهت بررسی ساختارهای پیشنهادی برای کنترل تحملپذیر عیب، از مدل ریاضی سیستم بیماری دیابت و سرطان ملانوما استفاده میشود. در درمان سرطان ملانوما در حضور عیب، نیمه عمر دارو هم لحاظ گردیده است که در مسایلی که هدف تعیین دوز بهینه دارو میباشد بسیار مهم میباشد منتهی در کارهای بسیار کمی این مورد لحاظ گردیده است.
کلید واژه ها (نمایه ها):
#کنترل تحملپذیر عیب #یادگیری تقویتی #مسیرهای شایستگی #شبکههای عصبی مصنوعی #یادگیری-Q دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: