崗位職責(zé):
1. AI 應(yīng)用后端開發(fā)與交付(核心職責(zé))
基于 Python (FastAPI / Flask) 構(gòu)建高可用的 AI 應(yīng)用后端服務(wù),設(shè)計(jì)并對(duì)外提供標(biāo)準(zhǔn)的 RESTful API。
負(fù)責(zé) AI 業(yè)務(wù)模塊的工程化實(shí)現(xiàn),包括并發(fā)處理、異常重試機(jī)制、流式輸出(Streaming)響應(yīng)封裝等。
對(duì)接前端或業(yè)務(wù)系統(tǒng),確保 AI 功能在真實(shí)業(yè)務(wù)場(chǎng)景下的穩(wěn)定性與響應(yīng)速度。
2. RAG(檢索增強(qiáng)生成)系統(tǒng)建設(shè)
負(fù)責(zé)本地知識(shí)庫(kù)的數(shù)據(jù)清洗與處理(PDF/Word/Excel/HTML等非結(jié)構(gòu)化數(shù)據(jù)的提取與分塊)。
設(shè)計(jì)并優(yōu)化 RAG 全鏈路:包括 Embedding 模型選擇、向量數(shù)據(jù)庫(kù)維護(hù)、檢索策略優(yōu)化(混合檢索/Rerank)。
解決由數(shù)據(jù)質(zhì)量或檢索邏輯導(dǎo)致的“幻覺(jué)”問(wèn)題,提升回答準(zhǔn)確率。
3. Agent 智能體編排與 Prompt 工程
利用 LangChain / LangGraph 等框架,將復(fù)雜的業(yè)務(wù) SOP 拆解為 AI 可執(zhí)行的工作流。
撰寫并調(diào)試復(fù)雜的 Prompt,通過(guò)結(jié)構(gòu)化輸出、CoT等技巧,確保模型輸出符合業(yè)務(wù)規(guī)范。
設(shè)計(jì) Tool/Function Calling,讓大模型能夠精準(zhǔn)調(diào)用外部 API 或查詢數(shù)據(jù)庫(kù)。
4. 持續(xù)優(yōu)化與業(yè)務(wù)賦能
效果評(píng)測(cè): 建立自動(dòng)化評(píng)測(cè)機(jī)制,量化 AI 回答的準(zhǔn)確率與召回率,驅(qū)動(dòng)產(chǎn)品迭代。
成本控制: 關(guān)注 Token 消耗,通過(guò) Prompt 優(yōu)化、緩存機(jī)制(Caching)或模型路由策略,降低運(yùn)營(yíng)成本。
模型落地: 探索開源模型(如 Llama3, Qwen, DeepSeek)的私有化部署(Ollama/vLLM),在特定場(chǎng)景替代商業(yè) API。
任職要求:
1. 基礎(chǔ)門檻
計(jì)算機(jī)、軟件工程、數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷。
精通 Python,擁有良好的編碼規(guī)范,熟練掌握 FastAPI 或 Flask 框架,能獨(dú)立開發(fā)后端服務(wù)。
至少具有 2個(gè) 完整的 AI 應(yīng)用項(xiàng)目落地經(jīng)驗(yàn)(需在面試中展示具體負(fù)責(zé)模塊)。
2. 核心技能
RAG 實(shí)戰(zhàn)經(jīng)驗(yàn): 深入理解 RAG 原理,熟悉向量數(shù)據(jù)庫(kù)的使用,極強(qiáng)的數(shù)據(jù)處理與清洗能力(熟練使用 Pandas/Regex 處理混亂文本)。
Prompt 調(diào)試能力: 有豐富的 Prompt 調(diào)優(yōu)經(jīng)驗(yàn),能通過(guò) Prompt 解決模型不遵循指令、格式錯(cuò)誤等問(wèn)題。
框架應(yīng)用: 熟練使用 LangChain、LlamaIndex 或類似編排框架,理解 Agent、Chain、Memory 的工作原理。
3. 工程與業(yè)務(wù)素養(yǎng)
熟悉 Linux 環(huán)境,掌握 Docker 容器化部署,能將開發(fā)的 AI 服務(wù)打包交付。
熟悉 SQL 數(shù)據(jù)庫(kù)(MySQL/PostgreSQL),能進(jìn)行基本的表設(shè)計(jì)與查詢。
具備產(chǎn)品思維,能理解業(yè)務(wù)需求背后的真實(shí)意圖,不唯技術(shù)論,以解決問(wèn)題為導(dǎo)向。
加分項(xiàng):
1.有醫(yī)療信息化、互聯(lián)網(wǎng)醫(yī)療或醫(yī)療保險(xiǎn)行業(yè)開發(fā)經(jīng)驗(yàn)者優(yōu)先。
2.了解醫(yī)療標(biāo)準(zhǔn)(如 ICD-10 編碼、HL7)或醫(yī)保支付政策(DRG/DIP)邏輯者優(yōu)先。
3.有 OCR接口對(duì)接或結(jié)構(gòu)化提取項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
4.熟悉前端技術(shù)(Vue/React),能快速搭建演示 Demo者優(yōu)先。
5.能閱讀 Java 代碼,具備跨語(yǔ)言接口聯(lián)調(diào)經(jīng)驗(yàn)者優(yōu)先。
6.熟悉 LoRA/QLoRA 微調(diào)流程,或有使用 API 進(jìn)行 Fine-tuning 經(jīng)驗(yàn)者優(yōu)先。
7.有高并發(fā)接口優(yōu)化經(jīng)驗(yàn),或熟悉 Redis 緩存策略者優(yōu)先。
8.具備大模型微調(diào)、模型蒸餾、推理優(yōu)化經(jīng)驗(yàn)者優(yōu)先。