Patent Name:基于深度強(qiáng)化學(xué)習(xí)的水下機(jī)器人軌跡控制方法及控制系統(tǒng)
Patent Number:2017104793330
Place of Registration:中國
Type:機(jī)械
Class:機(jī)械
Contacts:溫建梅
Contact Information:020-38743199
Patent Profile:
當(dāng)前權(quán)利人:華南師范大學(xué)
本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的水下機(jī)器人軌跡控制方法及控制系統(tǒng),包括學(xué)習(xí)階段和應(yīng)用階段;在學(xué)習(xí)階段,通過仿真器模擬水下機(jī)器人的運(yùn)作過程,采集仿真器所模擬的正在運(yùn)作的水下機(jī)器人的數(shù)據(jù),包括各時(shí)刻的狀態(tài)和各時(shí)刻對應(yīng)下一時(shí)刻的目標(biāo)狀態(tài),通過這些數(shù)據(jù)針對決策神經(jīng)網(wǎng)絡(luò)、輔助決策神經(jīng)網(wǎng)絡(luò)、評價(jià)神經(jīng)網(wǎng)絡(luò)和輔助評價(jià)神經(jīng)網(wǎng)絡(luò)四個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí);在應(yīng)用階段,獲取到水下機(jī)器人當(dāng)前時(shí)刻的狀態(tài)以及下一時(shí)刻的目標(biāo)狀態(tài),然后輸入至學(xué)習(xí)階段最終學(xué)習(xí)得到的決策神經(jīng)網(wǎng)絡(luò)中,通過決策神經(jīng)網(wǎng)絡(luò)計(jì)算出水下機(jī)器人當(dāng)前時(shí)刻需要的推進(jìn)力。本發(fā)明可以實(shí)現(xiàn)水下機(jī)器人運(yùn)動軌跡的精確控制。