專(zhuān)利名稱(chēng) 一種基于深度強(qiáng)化學(xué)習(xí)的機(jī)器人路徑規(guī)劃方法
申請(qǐng)?zhí)?專(zhuān)利號(hào) CN202510681542.8 專(zhuān)利權(quán)人(第一權(quán)利人) 長(zhǎng)春工業(yè)大學(xué)
申請(qǐng)日 2025-05-26 授權(quán)日 2025-12-12
專(zhuān)利類(lèi)別 授權(quán)發(fā)明 戰(zhàn)略新興產(chǎn)業(yè)分類(lèi) 新一代信息技術(shù)
技術(shù)主題 機(jī)器人路徑規(guī)劃|機(jī)器人|路徑計(jì)劃|農(nóng)業(yè)環(huán)境|自適應(yīng)|運(yùn)籌學(xué)|強(qiáng)化學(xué)習(xí)|多模態(tài)|微分對(duì)策|實(shí)時(shí)計(jì)算|網(wǎng)絡(luò)參數(shù)
應(yīng)用領(lǐng)域 車(chē)輛位置/路線/高度控制|位置/方向控制
意向價(jià)格 具體面議
專(zhuān)利概述 本發(fā)明公開(kāi)一種基于深度強(qiáng)化學(xué)習(xí)的機(jī)器人路徑規(guī)劃方法,涉及智慧農(nóng)業(yè),路徑規(guī)劃,機(jī)器人等領(lǐng)域。首先進(jìn)行農(nóng)場(chǎng)環(huán)境感知與定義機(jī)器人狀態(tài)空間與動(dòng)作空間,并設(shè)置多模態(tài)加權(quán)組合獎(jiǎng)勵(lì)機(jī)制與經(jīng)驗(yàn)回放緩沖區(qū)。在傳統(tǒng)DDPG算法中的Critic網(wǎng)絡(luò)損失函數(shù)中引入可學(xué)習(xí)的權(quán)重系數(shù),并在Actor網(wǎng)絡(luò)的目標(biāo)函數(shù)中加入熵正則化項(xiàng),再通過(guò)自適應(yīng)衰減貪心策略選擇微分博弈生成控制策略或DDPG算法生成動(dòng)作,最后執(zhí)行動(dòng)作或控制策略,更新網(wǎng)絡(luò)參數(shù)與目標(biāo)網(wǎng)絡(luò)參數(shù),并動(dòng)態(tài)更新經(jīng)驗(yàn)回放緩沖區(qū)。與其他路徑規(guī)劃方法相比,本方提高了路徑規(guī)劃對(duì)動(dòng)態(tài)環(huán)境的適應(yīng)性,在復(fù)雜的農(nóng)業(yè)環(huán)境下,也具備良好的效率及安全性。
圖片資料 一種基于深度強(qiáng)化學(xué)習(xí)的機(jī)器人路徑規(guī)劃方法
合作方式 具體面議
聯(lián)系人 戚梅宇 聯(lián)系電話 13074363281