崗位職責:
1.負責大規(guī)模預訓練模型(LLM)的設(shè)計、開發(fā)、訓練及調(diào)優(yōu),包括架構(gòu)創(chuàng)新、參數(shù)效率提升等;
2.負責數(shù)據(jù)處理與工程化,構(gòu)建高質(zhì)量多模態(tài)訓練數(shù)據(jù)集,設(shè)計數(shù)據(jù)清洗、增強及標注策略等;
3.負責模型部署與性能優(yōu)化,實現(xiàn)模型的高效推理部署,優(yōu)化GPU/TPU資源利用率,研究模型服務化方案(如API服務、邊緣端部署),解決延遲、吞吐量等性能瓶頸;
4.與產(chǎn)品、業(yè)務團隊深度合作,將技術(shù)能力轉(zhuǎn)化為實際應用場景,撰寫技術(shù)文檔、專利及論文,推動團隊技術(shù)影響力。
任職資格:
1.計算機科學、軟件工程、數(shù)學或相關(guān)領(lǐng)域統(tǒng)招本科及以上學歷;
2.3年以上算法研發(fā)經(jīng)驗,精通PyTorch框架,且滿足下列條件之一:
- 大模型(10B+參數(shù))訓練/微調(diào)實戰(zhàn)經(jīng)驗,深入理解Transformer、注意力機制、RLHF等核心技術(shù),具備模型源碼級調(diào)優(yōu)能力。理解RAG技術(shù)鏈實現(xiàn)邏輯,有自研RAG算法能力;
- 熟悉Megatron-LM、DeepSpeed等分布式訓練工具,熟練使用CUDA、TensorRT等加速庫,具有模型優(yōu)化部署能力;
- 熟悉計算機視覺領(lǐng)域,有分類/檢測/分割的實際落地項目經(jīng)驗。熟悉傳統(tǒng)圖像算法;
- 熟悉運籌優(yōu)化算法理論,有人員排班/車輛路徑規(guī)劃等項目經(jīng)驗。
3.熟悉發(fā)明專利的撰寫規(guī)范,有相應經(jīng)驗者優(yōu)先。