工作職責:
1.主導大模型(LLM、CV、多模態(tài)、時序等主流大模型)智能體或RAG等關鍵技術的訓練框架設計、分布式訓練優(yōu)化及推理加速技術研發(fā)。
2.負責模型壓縮(量化、剪枝)、低資源推理(邊緣計算/端側部署)及性能調優(yōu),提升模型效率與成本收益。
3.搭建高可用訓練基礎設施(如GPU集群管理、分布式訓練框架開發(fā)),解決超大規(guī)模數(shù)據并行與模型并行的技術難題。
4.作為核心骨干配合國家省部級項目申報、建設和交付等。
5.跟蹤前沿技術,推動技術成果在業(yè)務場景的轉化。
6.帶領研發(fā)團隊完成技術攻關,制定技術規(guī)劃和路線,協(xié)調跨部門資源推進項目落地。
任職要求:
1. 計算機科學、人工智能、數(shù)學等相關專業(yè),博士學位。
2. 工作經驗:三年以上大模型訓練/推理研發(fā)經驗和團隊管理經驗。
3. 技術能力:
(1)技術視野開闊,具備跨團隊協(xié)作與復雜項目管理能力,能承受高壓環(huán)境
(2)精通PyTorch/TensorFlow等框架,熟悉Megatron-LM、DeepSpeed等分布式訓練工具;
(3)深入理解Transformer/BERT/GPT等模型架構,具備模型并行、流水線并行實戰(zhàn)經驗;
(4)熟悉模型量化(INT8/FP16)、知識蒸餾、推理引擎(TensorRT/ONNX Runtime)優(yōu)化技術;
(5)有千億參數(shù)級模型訓練或高并發(fā)推理系統(tǒng)開發(fā)經驗者優(yōu)先。
4. 學術能力:在國際頂會(NeurIPS/ICML/ACL等)發(fā)表相關論文或擁有專利者優(yōu)先。
5. 正直誠信,積極上進,吃苦耐勞,善于溝通。
6. 具有高度的責任心和出色的團隊領導力、書面表達力及抗壓能力。