足式機器人強化學習運動控制算法工程師(四足/雙足方向)
崗位職責
1. 核心算法研發(fā):設計并實現(xiàn)基于強化學習的足式機器人運動控制策略,涵蓋步態(tài)規(guī)劃(行走、奔跑、爬坡、越障)、全身協(xié)調(diào)控制(WBC)、平衡控制及動態(tài)抗干擾算法,解決復雜非結構化環(huán)境下的運動穩(wěn)定性問題。
2. 強化學習體系構建:負責離線/在線強化學習算法(PPO、SAC、DDPG等)的選型、訓練與優(yōu)化,設計合理的獎勵函數(shù)、課程學習方案及域隨機化策略,提升模型泛化能力與訓練效率。
3. 仿真與實機閉環(huán):基于MuJoCo、Isaac Sim/Pybullet等仿真平臺搭建高保真物理仿真環(huán)境,完成算法離線驗證;主導Sim2Real遷移落地,解決仿真與實機差異(機械間隙、傳感器噪聲),實現(xiàn)算法在實體機器人上的部署與迭代。
4. 工程化落地:基于ROS/ROS2架構與Linux實時系統(tǒng),用C++/Python完成算法代碼開發(fā)、移植與優(yōu)化,確保實時調(diào)度周期≤1ms,滿足足式機器人動態(tài)運動的實時性要求。
5. 跨團隊協(xié)同:與機械硬件、感知導航、嵌入式開發(fā)團隊緊密協(xié)作,對接傳感器數(shù)據(jù)(IMU、編碼器)與硬件約束,解決關節(jié)限位、力矩超限等系統(tǒng)級適配問題;聯(lián)合調(diào)試“感知-決策-控制”全鏈路閉環(huán)。
6. 技術前沿追蹤:關注ICRA、IROS、RSS等頂會頂刊,追蹤強化學習、具身智能在足式機器人領域的前沿進展,將新技術、新方法融入產(chǎn)品研發(fā),持續(xù)提升機器人運動性能與環(huán)境適應性。
任職要求
1. 學歷與專業(yè):碩士及以上學歷,控制科學與工程、機器人學、自動化、計算機科學、人工智能、機械電子工程等相關專業(yè)。
2. 專業(yè)基礎:
(1)扎實掌握機器人運動學、動力學建模與現(xiàn)代控制理論(MPC、LQR、WBC、自適應控制等),理解足式機器人運動控制核心邏輯;
(2)深入理解深度強化學習核心算法原理與實現(xiàn)細節(jié),具備模型調(diào)參、獎勵函數(shù)優(yōu)化的實踐經(jīng)驗。
3. 技術能力:
(1)精通C++/Python編程,熟練使用PyTorch/TensorFlow等深度學習框架,具備高質(zhì)量、高可維護性代碼編寫能力;
(2)熟練操作至少一種機器人仿真平臺(MuJoCo/Isaac Sim/Gazebo),具備ROS/ROS2開發(fā)經(jīng)驗,了解Linux實時系統(tǒng)(如RT_PREEMPT)者優(yōu)先;
(3)掌握URDF/SDF建模標準,熟悉RBDL、pinocchio等動力學庫,能獨立完成復雜機器人系統(tǒng)建模與仿真驗證。
4. 項目經(jīng)驗:
(1)具備2年以上足式機器人(四足/雙足)或多關節(jié)機器人運動控制研發(fā)經(jīng)驗,有完整的“算法設計-仿真驗證-實機部署”項目閉環(huán)經(jīng)驗;
(2)有強化學習算法在機器人上的落地經(jīng)驗,成功解決Sim2Real遷移問題或復雜環(huán)境下運動穩(wěn)定性問題者優(yōu)先。
5. 個人素質(zhì):
(1)具備極強的問題定位與解決能力,能快速響應實機調(diào)試中的突發(fā)問題(如步態(tài)不穩(wěn)、力矩波動),24小時內(nèi)輸出修復方案;
(2)目標導向,抗壓能力強,具備良好的團隊協(xié)作與跨部門溝通能力,能適應短周期項目迭代節(jié)奏。
6.加分項
1. 在ICRA、IROS、RSS、NeurIPS等頂會頂刊發(fā)表過強化學習、機器人運動控制相關論文;
2. 有足式機器人步態(tài)控制、全身協(xié)調(diào)控制或力控相關競賽獲獎經(jīng)歷,或主導核心算法實現(xiàn)關鍵性能指標突破(如跌倒率≤1%/1h、步態(tài)穩(wěn)定性≥98%);
3. 熟悉GPU加速(CUDA/OpenCL)、TensorRT推理優(yōu)化,具備嵌入式平臺(NVIDIA Jetson系列)算法部署與性能優(yōu)化經(jīng)驗;
4. 具備多傳感器信息融合(IMU、深度相機、3D雷達)或SLAM、導航算法相關經(jīng)驗,能提升機器人環(huán)境適應性者優(yōu)先。