職位描述
崗位職責(zé):
日常實習(xí):面向全體在校生,為符合崗位要求的同學(xué)提供為期3個月及以上的項目實踐機會。
團隊介紹:大模型數(shù)據(jù)服務(wù)中心,是抖音集團旗下為大模型業(yè)務(wù)提供數(shù)據(jù)、評估、運營等專業(yè)解決方案的團隊;
主要承接大模型數(shù)據(jù)生產(chǎn)、大模型評估及運營相關(guān)的業(yè)務(wù),與研發(fā)、產(chǎn)品等團隊緊密合作,在預(yù)訓(xùn)練、數(shù)據(jù)監(jiān)督微調(diào)、模型強化學(xué)習(xí)、模型能力評估、產(chǎn)品運營等大模型全鏈路數(shù)據(jù)環(huán)節(jié),共同推動模型能力持續(xù)提升與應(yīng)用。
1、深入理解AI大模型,通過數(shù)據(jù)挖掘、數(shù)據(jù)合成、人工構(gòu)造等方式生產(chǎn)高質(zhì)量數(shù)據(jù)集;
2、能通過PE/Workflow/Agent、代碼完成數(shù)據(jù)預(yù)處理、分析和清洗以及數(shù)據(jù)評估等,探索更高效的數(shù)據(jù)生產(chǎn)方式;
3、能通過輸出和帶教,提升數(shù)據(jù)團隊對技術(shù)和大語言模型的了解,推動團隊達(dá)成業(yè)務(wù)目標(biāo)。
任職要求:
1、碩士及以上學(xué)位在讀,計算機、人工智能等相關(guān)專業(yè)優(yōu)先;
2、有大模型算法/工程相關(guān)實習(xí)經(jīng)驗者優(yōu)先;
3、具備良好的代碼能力、基礎(chǔ)算法功底,熟練使用Python/Java等語言,熟悉大模型SFT、RM、RL等算法和技術(shù),具備PE能力,能夠獨立設(shè)計Prompt策略形成工作流,提高數(shù)據(jù)生產(chǎn)的質(zhì)量和效率;
4、對文本內(nèi)容和數(shù)據(jù)質(zhì)量有較好判斷力,有自己擅長的內(nèi)容領(lǐng)域/體裁(如小說、對話、研報等)優(yōu)先;
5、對AI有高度熱情,做事靠譜,有很強的自驅(qū)力和學(xué)習(xí)能力。