国产精品又长又粗又爽又黄的毛片, 国产AV无码专区亚洲AV毛片搜, 丰满人妻被猛烈进入中文字幕四川, 国产精品一区二区三区国产女人喷,亚洲国产欧美日韩图片在线人,潘娇娇337p人艺体艺术,成人免费无码大片a毛片古装,一本到高清视频免费,人妻在线视频免费看

更新于 9月3日

LLM 數據工程與微調研發(fā)實習生

150-210元/天
  • 上海徐匯區(qū)
  • 本科
  • 實習
  • 招1人
  • 6個月
  • 5天/周

職位描述

可轉正實習證明PYTHON/PANDASHF TRANSFORMERS計算機LLM計算機軟件云計算/大數據人工智能
一、核心職責
1. 訓練數據處理與生成:針對 LLM 訓練需求,清洗并規(guī)范化多源數據(文本 / 表格 / 日志),完成數據脫敏、去重、去噪,輸出符合訓練標準的語料;結合交通 / 政務 / 停車等業(yè)務場景,設計提示詞模板與采樣策略(含 system prompt、shot 數量、temperature/top-p 參數),批量生成高質量問答對與指令數據,并搭建 “生成 - 過濾 - 審?!?閉環(huán)機制,保障數據質量。
2. 微調數據流水線構建:負責 LLM 微調數據全流程搭建,涵蓋數據切分、格式適配(Alpaca/ShareGPT 規(guī)范)、多輪質檢與版本化管理,確保數據鏈路可追溯。
3. LLM 微調執(zhí)行與協助:執(zhí)行并協助團隊完成 LLM 參數高效微調任務(LoRA/QLoRA/PEFT),實時監(jiān)控訓練關鍵指標(loss、grad norm、VRAM 占用、TPS 等),輸出可復現的訓練腳本,配合團隊優(yōu)化微調效果。
4. 模型評測與驗收:開展 LLM 離線基準評測(Exact-Match、F1、ROUGE、BERTScore、長度懲罰等指標),針對交通 / 政務 / 停車等領域數據集進行專項測試,對比基線模型與 A/B 測試結果,輸出評測報告。
5. 文檔與知識沉淀:梳理并沉淀崗位核心知識資產,包括 LLM 訓練數據標準、提示詞庫、模型評測報告、模型迭代變更記錄(changelog),支撐團隊技術復用。
二、任職要求
1. 學歷與實習時長:計算機、數據科學、人工智能等相關專業(yè)在讀(本科及以上);每周可到崗≥3 天,連續(xù)實習≥3 個月,能穩(wěn)定參與項目迭代。
2. 基礎技術能力:熟練掌握 Python 編程(必備);具備正則表達式應用、SQL 結構化查詢能力;扎實掌握 Linux 操作系統基礎與 Git 版本控制(如分支管理、提交規(guī)范、沖突解決)。
3. 模型認知基礎:熟悉 Transformer 模型核心原理(如 Tokenization、上下文窗口機制),理解 SFT(監(jiān)督微調)、指令微調及模型對齊的核心邏輯,能清晰區(qū)分不同微調方式的適用場景。
4. 工作能力要求:具備快速試錯與迭代意識,能基于數據驗證提示詞優(yōu)化效果,以 “產出高質量結果” 為導向,主動推進任務落地。
三、加分項
1. 微調與工具經驗:了解 LoRA/QLoRA 等參數高效微調技術,或使用過 DeepSpeed/Accelerate(訓練加速)、vLLM/TGI(推理部署)工具;有 HuggingFace Transformers、LlamaFactory 實操經驗者優(yōu)先。
2. 評測能力儲備:使用過 lm-eval-harness、OpenAI Evals 等 LLM 專業(yè)評測框架,或有自建領域評測集(如交通 / 政務場景)、設計評測指標的經驗。
3. 數據與開源經驗:參與過數據標注、眾包質檢、合成數據治理項目;曾向開源社區(qū)(如 HuggingFace、LlamaFactory)提交過 PR 并被合并者優(yōu)先。
四、技術棧(含應用場景)
類別 核心技術及應用說明
數據處理 Python/Pandas(數據清洗、分析與格式轉換)、SQL(結構化數據查詢與提取)
模型訓練 HF Transformers/PEFT/TRL(LLM 基礎訓練框架)、LoRA/QLoRA(參數高效微調)、DeepSpeed/Accelerate(訓練加速)、BitsAndBytes(低精度訓練)
服務與評測 vLLM/TGI(LLM 推理部署)、FastAPI(簡單服務搭建)、lm-eval-harness(評測框架)、Weights & Biases/Grafana(指標監(jiān)控與可視化)
協作與工具 Jupyter(數據探索與腳本調試)、VS Code(代碼開發(fā))、Git(版本控制與團隊協作)

工作地點

上海市-徐匯區(qū)-云視路1號星云1號大廈2樓

職位發(fā)布者

章天一/HR

立即溝通
公司Logo中城交(上海)科技有限公司
作為隧道股份孵化的上海首家國資背景垂類大模型企業(yè),中城交(上海)科技有限公司(簡稱“中城交”)聚焦交通與城市治理大模型領域,依托深厚的行業(yè)積淀、領先的技術優(yōu)勢與海量數據資產,為城市智能化升級提供全鏈條解決方案。公司以“數據驅動決策,AI重塑城市”為使命,致力于成為全國領先的城市治理大模型構建者。
公司主頁