| 專利名稱 | 一種減少車輛超參數調整的深度強化學習方法 | ||
|---|---|---|---|
| 申請?zhí)?專利號 | CN202411023989.8 | 專利權人(第一權利人) | 長春工業(yè)大學 |
| 申請日 | 2024-07-29 | 授權日 | 2024-12-06 |
| 專利類別 | 授權發(fā)明 | 戰(zhàn)略新興產業(yè)分類 | 新一代信息技術 |
| 技術主題 | 獎勵學習|超參數|學習架構|維修車輛|逆強化學習|非線性|仿真|決策控制 | ||
| 應用領域 | 資源分配|內燃活塞發(fā)動機|人造生命|物理實現|神經學習方法 | ||
| 意向價格 | 具體面議 | ||
| 專利概述 | 一種減少車輛超參數調整的深度強化學習方法,涉及基于深度強化學習的自動駕駛車輛減少超參數調整的技術領域。提出了深度逆強化學習的車輛操縱穩(wěn)定性非線性獎勵學習架構,并進一步提出了高速公路場景下自車非線性操縱穩(wěn)定性獎勵與行駛規(guī)則獎勵的自動駕駛集成決控策略,大大減少了在集成決控策略訓練過程中對車輛操穩(wěn)獎勵函數的超參數設置。本發(fā)明的步驟是:獲取深度逆強化學習訓練所需的專家策略;使用深度逆強化學習獲取車輛操縱穩(wěn)定性獎勵;使用多進程異步方法加速深度逆強化學習訓練速度;高速復雜場景中的車輛集成決控。本發(fā)明能夠在不依賴車輛大量的穩(wěn)定性超參數設置的基礎上,實現在高速場景中具有車輛穩(wěn)定性保持能力的集成決控。 | ||
| 圖片資料 |
|
||
| 合作方式 | 擬轉讓 | ||
| 聯系人 | 戚梅宇 | 聯系電話 | 13074363281 |