پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1397
پدیدآورندگان:
سامان خاک مردان [پدیدآور اصلی]، محسن رضوانی[استاد راهنما]، علی اکبر پویان[استاد راهنما]، منصور فاتح[استاد مشاور]، حمید علی نژاد رکنی [استاد مشاور]
چکیده: امروزه تحلیل اطلاعات پزشکی می‌تواند درک ما را نسبت به ساختار بدن انسان و همچنین عوامل تاثیر‌گذار بر آن را بالا برد. از این رو، پژوهشگران در حوزه علوم پزشکی برای جلوگیری از بروز بیماری ها در تلاشند این عوامل را شناسایی کنند. یکی از این عوامل تاثیرگذار، ساختار و نحوه قرارگیری رشته های DNA کروموزوم ها در یک فضای سه بعدی است. ایده اصلی این موضوع از جایی مطرح شد که در یک رشته درهم پیچیده DNA، فعل و انفعال بین دو ناحیه DNA زمانی که از نظر مکان فضایی به هم نزدیک هستند، تاثیر بسیار زیادی بر عملکرد بدن دارد. لذا پروتکل های آزمایشگاهی مختلفی برای بدست آوردن اطلاعات ساختاری کروموزوم ها توسعه یافته‌اند. یکی از این پروتکل ها روش Hi-C است. این پروتکل آزمایشگاهی دارای خطاهای سیستماتیک و آزمایشگاهی زیادی است. در نتیجه برای استفاده از این اطلاعات و فهم بهتر عملکرد بدن، نیاز به حذف نویز و استخراج اطلاعات معنی دار از این داده ها ضروری است. تا کنون پژوهش های زیادی در این زمینه انجام گرفته و همچنین روش های آماری مختلفی برای حل این مساله توسعه یافته اند. عموم این روش‌ها از یک رویکرد آماری سراسری برای تشخیص نویز استفاده کرده‌اند. حال آنکه با در نظر گرفتن یک رویکرد محلی می‌توان فرایند تشخیص نویز را بهبود داد. بنابراین در این رساله، دو رویکرد محلی و سراسری با هم ادغام شده‌اند. برای این منظور روشی بر پایه مدلی از شبکه عصبی عمیق به نام اتوانکدر، به دلیل توانایی این شبکه در حذف نویز، ارائه شده است. روش پیشنهادی ابتدا داده های Hi-C را به صورت آماری مدل می کند. سپس این روش با استفاده از شبکه عصبی مدل آماری بدست آمده را با توجه به تاثیر داده ها برروی یکدیگر بهبود می‌بخشد و به عبارت دیگر مدلی جدید را با استفاده از شبکه عصبی ایجاد می کند. نتایج شبیه سازی نشان می دهد که در روش پیشنهادی با 3771 فعل و انفعال معتبر شناسایی شده نسبت به روش مرجع (GOTHiC) با 3027 فعل و انفعال معتبر شناسایی شده، عملکرد بهتری داشته است. همچنین ضریب همبستگی بین مولفه فاصله و تعداد فعل و انفعالات بین دو ناحیه در روش پیشنهادی و روش مرجع به ترتیب برابر با 0/1951- و 0/0310- بوده است که در نتیجه روش پیشنهادی به فرض وابسته بودن تعداد فعل و انفعالات بین دو ناحیه به فاصله آن دو ناحیه، پایبندی بیشتری داشته است. به طور کلی در این پژوهش، ما نشان داده ایم که می توان با استفاده از شبکه عصبی به خوبی داده های Hi-C را مدل کرد و بر اساس مدل ایجاد شده توسط شبکه عصبی، نویز را حذف نمود و همچنین فعل و انفعالات معنی دار را در داده های Hi-C شناسایی کرد. علاوه بر این، همراه با توسعه روش پیشنهادی، ابزاری به نام MHiC را برای حذف نویز و شناسایی فعل و انفعالات معنی دار در محیط R توسعه داده ایم. در این ابزار علاوه ‌بر روش پیشنهادی، روش های GOTHiC، HiCNorm و FitHiC را نیز برای حذف نویز و شناسایی فعل و انفعالات معنی دار پیاده‌سازی نموده‌ایم. هر یک از روش های پیاده سازی شده در این ابزار بر خلاف پیاده‌سازی‌های موجود، توانایی دریافت ورودی از منابع HiC-Pro، HOMER، HiCUP و همچنین ورودی طراحی شده برای روش HiCNorm را دارا می‌باشند. همچنین ابزار مذکور داده های Hi-C را با استفاده از Contact map diagram و Arc diagram نمایش می دهد. ابزار ارائه شده امکان بصری‌سازی داده‌های Hi-C را فراهم نموده و مجموعه روش‌های موجود برای حذف نویز در این‌ داده‌ها را یکجا ارائه می‌نماید.
کلید واژه ها (نمایه ها):
#Hi-C #شبکه عصبی عمیق #حذف نویز #بیوانفورماتیک #رگرسیون
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)