深入理解 Transformer 架構、預訓練技術及主流 AI 框架(如 PyTorch);
熟悉自然語言處理、多模態(tài)融合、圖像識別、強化學習等典型AI任務;
掌握參數(shù)高效微調(diào)方法(LoRA、Prompt Tuning、Adapter 等)與推理加速技術;熟悉大規(guī)模模型訓練流程,具備模型安全性、穩(wěn)定性、可解釋性方面的實踐經(jīng)驗;
有高性能計算、算法優(yōu)化或AI 工程落地經(jīng)驗者優(yōu)先。
提供AI 模型技術路線與研發(fā)策略制定,評估不同任務的技術選型;指導模型研發(fā)團隊進行訓練計劃、算法調(diào)優(yōu)與推理優(yōu)化設計;
參與模型架構演進、壓縮部署方案設計與性能調(diào)測;
審核核心模型研發(fā)工作,推動模型工程化與可持續(xù)迭代優(yōu)化;
協(xié)助制定模型評估標準與測試框架,提供專家級技術支持。