崗位職責(zé):
1、開發(fā)大模型在各種應(yīng)用場景中的應(yīng)用,重點(diǎn)關(guān)注人機(jī)交互方面;負(fù)責(zé)語言大模型/多模態(tài)大模型的分析和性能調(diào)優(yōu)
2、深入理解業(yè)務(wù),進(jìn)行重點(diǎn)難點(diǎn)技術(shù)攻關(guān)工作,將技術(shù)實(shí)現(xiàn)與業(yè)務(wù)場景聯(lián)系起來,快速解決業(yè)務(wù)需求問題。
3、研究最新的自然語言處理算法,并將其應(yīng)用到我們的系統(tǒng)中,提高平臺的性能和競爭力;
4、負(fù)責(zé)算法的性能測試和調(diào)優(yōu)、Prompt設(shè)計(jì)、對預(yù)訓(xùn)練模型的分布式、加速訓(xùn)練及模型蒸餾、部署,保證算法的準(zhǔn)確性和效率;與團(tuán)隊(duì)合作,不斷改進(jìn)和優(yōu)化算法,推動平臺技術(shù)的發(fā)展。
5、負(fù)責(zé)大語言模型的訓(xùn)練、對齊、調(diào)優(yōu)以及下游應(yīng)用落地等相關(guān)工作,對大模型進(jìn)行預(yù)訓(xùn)練、微調(diào)、服務(wù)化等,對接業(yè)務(wù)需求,針對具體方向,提高準(zhǔn)確性和可用性
任職資格:
1、計(jì)算機(jī)科學(xué)、人工智能相關(guān)專業(yè)碩士及以上學(xué)歷,具備從事NLP、大語言模型(LLM)預(yù)訓(xùn)練算法研究、基礎(chǔ)大模型訓(xùn)練經(jīng)驗(yàn)(科研、工作經(jīng)驗(yàn)均可);
2、熟悉LLM大模型基本原理及應(yīng)用、Langchain框架及應(yīng)用,有GPT大模型研發(fā)經(jīng)驗(yàn)者優(yōu)先。
3、深入掌握機(jī)器學(xué)習(xí)和深度學(xué)習(xí),熟悉Tensorflow/PyTorch框架,熟練掌握GPT/Llama /BERT/Transformer框架;
4、熟悉Linux系統(tǒng),熟練使用Python語言進(jìn)行開發(fā),數(shù)學(xué)理論基礎(chǔ)扎實(shí),編程實(shí)現(xiàn)能力高效;
5、有良好的溝通表達(dá)能力,積極向上,細(xì)致認(rèn)真。