پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1399
پدیدآورندگان:
فرشته ریاحی [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]
چکیده: دردﻧﯿﺎیاﻣﺮوزﺑﻪدﻟﯿﻞاﻓﺰاﯾﺶﺣﺠﻢاﻃﻼﻋﺎتاﯾﻨﺘﺮﻧﺘوﻓﺮاواﻧﻓﺮﻫﻨﮓ ﻫﺎیﻣﺨﺘﻠﻒدﯾﺠﯿﺘﺎﻟ، وﺟﻮدﺗﺸﺎﺑﻪدرداده ﻫﺎیﻣﺘﻨﺑﻪدﻻﯾﻞﻣﺨﺘﻠﻔاﻓﺰاﯾﺶﭘﯿﺪاﮐﺮدهاﺳﺖ،ﺑﻪﻫﻤﯿﻦدﻟﯿﻞﺗﺨﻤﯿﻦ ﻣﯿﺰانﺷﺒﺎﻫﺖﻣﯿﺎنآن ﻫﺎاﻣﺮیﺿﺮوریﺑﻪﺣﺴﺎبﻣ آﯾﺪ. ﻫﻤﭽﻨﯿﻦﯾﺎﻓﺘﻦﺷﺒﺎﻫﺖﻣﯿﺎنداده ﻫﺎی ﻣﺘﻨدرزﻣﯿﻨﻪ ﻫﺎﯾﯽﻫﻤﭽﻮنﺳﯿﺴﺘﻢ ﻫﺎیﺑﺎزﯾﺎﺑﯽاﻃﻼﻋﺎت،ﺳﺮﻗﺖادﺑﯽ،داده ﮐﺎوی،ﻃﺒﻘﻪ ﺑﻨﺪی اﺳﻨﺎدوﻣﻮاردﺑﺴﯿﺎردﯾﺮیﻣﻮرداﺳﺘﻔﺎدهﻗﺮارﻣ ﮔﯿﺮد. ﺑﺎورودﺟﻤﻠﻪﯾﺎﺳﻨﺪﯾﺎﻣﺘﻨﺑﻪﺳﯿﺴﺘﻢ،ﻣﯿﺰانﺷﺒﺎﻫﺖآنﺑﺎاﺳﻨﺎدﻣﻮﺟﻮدﻣﻮردﺑﺮرﺳﻗﺮار ﻣ ﮔﯿﺮدودرزﻣﯿﻨﻪﻣﻮردﻧﻈﺮاﺳﺘﻔﺎدهﻣ ﺷﻮد. ﺗﺎﮐﻨﻮنروش ﻫﺎیﻣﺨﺘﻠﻒﭘﺮدازشزﺑﺎنﻃﺒﯿﻌو ﯾﺎدﮔﯿﺮیﻣﺎﺷﯿﻦﺑﺮایﻣﺤﺎﺳﺒﻪﻣﯿﺰانﺷﺒﺎﻫﺖداده ﻫﺎیﻣﺘﻨﻣﻌﺮﻓﺷﺪه اﻧﺪ.اﯾﻦروش ﻫﺎﺑﻪﻣﯿﺰان دﻗﺖﻣﺘﻔﺎوﺗدﺳﺖﯾﺎﻓﺘﻪ اﻧﺪ،ﺑﺮایﺑﻬﺒﻮداﯾﻦﻣﻌﯿﺎرﻧﯿﺎزاﺳﺖﺗﺎﭘﮋوﻫﺶ ﺑﻬﺘﺮیﺻﻮرتﮔﯿﺮد. از ﺟﻤﻠﻪروش ﻫﺎیآﻣﺎریﮐﻪﺟﺰروش ﻫﺎیﻣﺒﺘﻨﺑﺮﭘﯿﺮهﻣ ﺑﺎﺷﺪوازﺗﺮﮐﯿﺐاﯾﻦروشﺑﺎروش ﻫﺎی دﯾﺮﻣﺗﻮانﺑﻪﻧﺘﺎﯾﺞﺟﺎﻟﺐدﺳﺖﯾﺎﻓﺖ. دراﯾﻦﭘﮋوﻫﺶ،ﻗﺒﻞازﺗﺒﺪﯾﻞﻣﺘﻦﺑﻪﻓﺮﻣﺖﻗﺎﺑﻞﺧﻮاﻧﺪنﺑﺮایﻣﺎﺷﯿﻦ،ﭘﯿﺶ ﭘﺮدازشرویداده ﻫﺎ اﻋﻤﺎلﻣ ﺷﻮدﺗﺎوﯾﮋﮔ ﻫﺎﮐﺎﻫﺶﯾﺎﺑﺪودﻗﺖاﻧﺪازه ﮔﯿﺮیراﺑﺎﻻﺑﺒﺮد.ﭘﺲازآنﺑﺎاﺳﺘﻔﺎدهازﺗﺨﺼﯿﺺ ﭘﻨﻬﺎندﯾﺮﯾﻠﺖﻫﺮﮐﻠﻤﻪﺑﻪﯾﻧﻤﺮهﻫﻤﺒﺴﺘﮕاﺧﺘﺼﺎصﻣ ﯾﺎﺑﺪواﯾﻦروﻧﺪﺑﺮاﺳﺎساﺣﺘﻤﺎﻻتﺗﮑﺮار ﻣ ﺷﻮدﺗﺎاﺧﺘﺼﺎصﻧﻤﺮهﻫﻤﺒﺴﺘﮕﺑﻪﮐﻠﻤﺎتﺑﻬﺒﻮدﯾﺎﺑﺪوﺟﻤﻠﻪدردﺳﺘﻪﻣﻮردﻧﻈﺮﻗﺮارﮔﯿﺮد.ﺑﺮای اﺳﺘﻔﺎدهﺷﺪهاﺳﺖ.ﺳﭙﺲﺑﺮایﻣﺤﺎﺳﺒﻪﺷﺒﯿﻪ ﺗﺮﯾﻦﺟﻤﻼتازﻓﺎﺻﻠﻪdoc2bowﺑﺎزﻧﻤﺎﯾﯽﺟﻤﻼتﻧﯿﺰاز ﺟﻨﺴﻦﺷﺎﻧﻮنﮐﻪﺑﺎﻣﻘﺎﯾﺴﻪواﮔﺮاﯾﯽﺗﻮزﯾﻊﺑﺮﭼﺴﺐﻣﻮردﻧﻈﺮﺑﺪﺳﺖﻣ آﯾﺪاﺳﺘﻔﺎدهﺷﺪهاﺳﺖ.در اﻧﺘﻬﺎﻣﺎﺷﯿﻦﺑﺮدارﭘﺸﺘﯿﺒﺎنﺧﻄوﺗﺎﺑﻊﭘﺎﯾﻪﺷﻌﺎﻋراﺑﺮایدﺳﺘﻪ ﺑﻨﺪیﺟﻤﻼتﻣﺸﺎﺑﻪﺑﻪﮐﺎرﺑﺮده درﺻﺪرویﭘﺎﯾﺎه٠,٩٢اﺳﺖ. روشﭘﯿﺸﻨﻬﺎدیﺑﻪدﻗﺖدﺳﺘﻪ ﺑﻨﺪی٩٨درﺻﺪوﻧﻤﺮهﻫﻤﺒﺴﺘﮕ MaLSTMدرﺻﺪدﻗﺖﺑﻬﺘﺮیﻧﺴﺒﺖﺑﻪﭘﮋوﻫﺶ٣,٨دﺳﺖﭘﯿﺪاﮐﺮدهاﺳﺖوﺗﻮاﻧﺴﺘﻪاﺳﺖSICKداده داﺷﺘﻪﺑﺎﺷﺪ.
کلید واژه ها (نمایه ها):
#ﺷﺒﺎﻫﺖﻣﻌﻨﺎﯾﯽﻣﺘﻦ #ﺗﺨﺼﯿﺺﭘﻨﻬﺎندﯾﺮﯾﻠﺖ #ﺳﻨﺪﺑﻪﮐﯿﺴﻪﮐﻠﻤﺎت #ﻓﺎﺻﻠﻪ ﺟﻨﺴﻦﺷﺎﻧﻮن #ﻣﺎﺷﯿﻦﺑﺮدارﭘﺸﺘﯿﺒﺎن
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: