崗位職責(zé):
1、參與公司大模型的開源應(yīng)用落地,尤其是結(jié)合公司核心業(yè)務(wù)的實際應(yīng)用開發(fā)與實踐;
2、負(fù)責(zé)公司業(yè)務(wù)相關(guān)數(shù)據(jù)的處理工作,包括數(shù)據(jù)清洗、分類、分析和存儲,助力構(gòu)建高質(zhì)量的數(shù)據(jù)集;
3、協(xié)助公司業(yè)務(wù)知識庫的建設(shè),支持大模型文本生成、智能問答、知識圖譜等應(yīng)用的開發(fā)與優(yōu)化;
4、負(fù)責(zé)大模型微調(diào)與優(yōu)化工作,涵蓋主流大模型(如Qwen、DeepSeek等),使用Dify、Langchain、Ollama等開發(fā)工具,以及LORA技術(shù)提升模型性能;
5、持續(xù)關(guān)注大模型領(lǐng)域的技術(shù)前沿,及時跟進(jìn)最新研究動態(tài)與行業(yè)趨勢,并結(jié)合公司實際需求提出創(chuàng)新思路與解決方案。同時,參與數(shù)據(jù)挖掘,完成大模型訓(xùn)練數(shù)據(jù)集的構(gòu)建。
任職資格:
1、計算機(jī)、人工智能、數(shù)學(xué)、自然語言處理等相關(guān)專業(yè)本科及以上學(xué)歷,具備一定的學(xué)術(shù)背景和實踐經(jīng)驗;
2、熟練掌握Python,熟悉PyTorch以及最新的Transformer、diffusion等模型架構(gòu),具備常見深度學(xué)習(xí)模型的應(yīng)用經(jīng)驗;
3、熟悉多個主流大模型(如GPT、Gemini、LLaMA、Claude、DeepSeek、Qwen等)的工作原理及應(yīng)用,精通Dify、Langchain、Ollama等一種或多種開源LLM/Agent開發(fā)框架;
4、有豐富的深度學(xué)習(xí)、多模態(tài)、NLP、大模型等領(lǐng)域的相關(guān)模型訓(xùn)練和調(diào)試經(jīng)驗,優(yōu)先考慮有多機(jī)多卡訓(xùn)練、全參數(shù)微調(diào)、加速、蒸餾以及高質(zhì)量數(shù)據(jù)構(gòu)建等相關(guān)經(jīng)驗者;
5、擁有扎實的自然語言處理(NLP)或機(jī)器學(xué)習(xí)算法理論基礎(chǔ),熱衷于AI產(chǎn)品或NLP應(yīng)用的開發(fā)與實踐經(jīng)驗者優(yōu)先;
6、在大數(shù)據(jù)處理、大規(guī)模分布式計算、分布式訓(xùn)練等領(lǐng)域有科研或?qū)嵺`經(jīng)歷優(yōu)先;
7、具備較強(qiáng)的學(xué)習(xí)能力和問題解決能力,能夠在快節(jié)奏環(huán)境中工作。