1、參與LLM的架構(gòu)設(shè)計、預(yù)訓練策略制定與優(yōu)化方案實施
2、開發(fā)和實現(xiàn)LLM的高效微調(diào)技術(shù)(LoRA、QLoRA、P-tuning等)
3、探索和優(yōu)化長文本處理、復雜推理、多輪對話等核心能力
4、實施模型壓縮、量化、蒸餾等部署優(yōu)化方案
5、設(shè)計并開發(fā)高效的提示工程與上下文學習策略
6、分析和解決LLM訓練中的穩(wěn)定性、收斂性和性能問題
有LLM預(yù)訓練、指令微調(diào)、人類反饋強化學習(RLHF)實踐經(jīng)驗豐富,5年以上。
工作性質(zhì):兼職合作,時間靈活
協(xié)作模式:遠程辦公,配合必要的線上同步
時間投入:每周15-20小時,具體可根據(jù)項目階段協(xié)商
優(yōu)秀者可建立長期合作關(guān)系