崗位職責(zé)
負(fù)責(zé)在大語言模型基座基礎(chǔ)上,結(jié)合領(lǐng)域數(shù)據(jù)開展模型研發(fā)與優(yōu)化,推動模型在本領(lǐng)域知識理解、問答、診斷等場景落地,主要工作包括:
1.數(shù)據(jù)處理與構(gòu)建
2.模型研發(fā)
3.工程與部署
4.持續(xù)優(yōu)化
任職要求
1.計算機(jī)、人工智能、機(jī)器學(xué)習(xí)、農(nóng)業(yè)信息化或相關(guān)專業(yè)碩士及以上學(xué)歷;
2.具備扎實的 NLP 與深度學(xué)習(xí)理論基礎(chǔ),熟悉 Transformer、LLM 訓(xùn)練原理、優(yōu)化策略等;
3.熟練掌握模型訓(xùn)練工具鏈(如 PyTorch、HuggingFace 等);
4.有大模型繼續(xù)預(yù)訓(xùn)練 / 指令微調(diào) / 多模態(tài)訓(xùn)練經(jīng)驗者優(yōu)先;
5.具備 GPU 集群訓(xùn)練經(jīng)驗,熟悉分布式訓(xùn)練框架,能處理性能優(yōu)化問題;
6.具備良好的編碼能力、工程思維、文檔能力與團(tuán)隊協(xié)作能力。
加分項
1.有 RAG、領(lǐng)域知識模型、Agent 研發(fā)經(jīng)驗
2.有大模型產(chǎn)品落地經(jīng)驗
3.熟悉 LangChain、vLLM、LLaMA、Qwen 等