【崗位職責】
1、數據采集與標注
參與具身智能相關多模態(tài)數據(圖像、點云、語言、動作等)的采集、清洗、標注、校對與質量檢查,確保數據準確性與一致性。按照標注規(guī)范,協助完成空間理解、視覺定位、任務規(guī)劃、多模態(tài)推理、可用性等方向的數據標注與預處理工作。
2、數據合成與增強輔助
協助實施數據合成與增強方案,利用仿真環(huán)境(如AI2THOR、AirSim、Gazebo、Isaac、Libero、ALOHA等)生成訓練數據,支持Sim2Real等前沿數據合成實驗。輔助探索生成式AI、視頻生成大模型等在數據合成中的應用,提升數據多樣性與覆蓋度。
3、數據質量評估與治理支持
參與數據質量評估流程,包括數據完整性、準確性、一致性、可用性等維度的檢查與反饋,協助優(yōu)化數據質量監(jiān)控體系。協助制定數據采集、標注、評測等規(guī)范,參與數據治理標準化流程建設。
4、工具使用與流程優(yōu)化
學習并使用數據處理、標注、分析工具(如Python、Pandas、OpenCV、ROS等),參與數據Pipeline的搭建與維護,提升數據處理效率。
收集標注與數據處理中的問題,協助優(yōu)化標注工具與流程,提升團隊數據生產效率。
5、文檔撰寫與團隊協作
協助撰寫數據處理文檔、標注規(guī)范、實驗報告等,保障項目知識沉淀與團隊協作。與算法、仿真、機器人等團隊協作,支持數據需求對接、數據集版本管理與迭代。
【崗位要求】
1、學歷與專業(yè)背景
本科及以上在讀,計算機、人工智能、機器人、自動化、數學、數據科學等相關專業(yè)優(yōu)先。能保證每周至少4天、連續(xù)3個月以上的實習時間,可全勤者優(yōu)先。
2、編程與工具能力
熟悉Python編程,了解Pandas、Numpy等數據處理庫,有OpenCV、ROS、Hugging Face等工具使用經驗者優(yōu)先。了解AI2THOR、AirSim、Gazebo、Isaac、Libero、ALOHA等至少一種仿真環(huán)境,有機器人或仿真平臺數據采集經驗者優(yōu)先。
3、數據集與合成技術認知
了解具身智能常用數據集(如RoboMIND、OpenX-Embodiment、DROID等),熟悉數據標注、清洗、增強的基本流程。對數據合成、Sim2Real、生成式AI等技術有濃厚興趣,有相關課程或項目經驗者優(yōu)先。
4、數據質量與評估能力
具備良好的細節(jié)觀察力與耐心,對數據準確性有高度敏感性,能發(fā)現并反饋數據問題。了解數據質量評估方法(如邏輯檢查、可視化分析、誤差分析等),愿意參與數據治理與標準化建設。
5、軟技能與綜合素質
具備優(yōu)秀的學習能力、邏輯思維與團隊協作能力,能夠快速掌握新技術與工具。
具備良好的英文閱讀能力,能閱讀英文技術文檔與文獻,有開源項目、競賽或論文經歷者優(yōu)先。