崗位職責(zé)
構(gòu)建高可靠、高可用的大模型運(yùn)營(yíng)管理平臺(tái),協(xié)助內(nèi)部業(yè)務(wù)與外部客戶高效使用模型能力,主要包括:
1.多模型接入、使用額度計(jì)費(fèi)管理
2.運(yùn)行狀態(tài)監(jiān)控與可觀測(cè)性建設(shè)
3.高可用系統(tǒng)架構(gòu)設(shè)計(jì)
4.后端系統(tǒng)開發(fā)與平臺(tái)建設(shè)
5.模型接入業(yè)務(wù)場(chǎng)景落地
o支持業(yè)務(wù)方接入模型能力,如 Agent 應(yīng)用、RAG 系統(tǒng)、行業(yè)應(yīng)用 API
o參與產(chǎn)品規(guī)劃,從系統(tǒng)角度提出平臺(tái)功能優(yōu)化建議
任職要求
1.碩士及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè)優(yōu)先,5年以上 Java 后端開發(fā)經(jīng)驗(yàn)
2.精通 Java 核心技術(shù),掌握 Spring Boot / Spring Cloud / MyBatis / Netty 等主流生態(tài)框架
3.熟悉高并發(fā)、高可用、大流量服務(wù)端架構(gòu)設(shè)計(jì)與性能調(diào)優(yōu)
4.熟悉 MySQL / Redis / Kafka / ElasticSearch 等常用中間件與數(shù)據(jù)庫(kù)技術(shù)
5.具備良好的系統(tǒng)分析能力與工程落地能力,能獨(dú)立承擔(dān)平臺(tái)級(jí)項(xiàng)目
加分項(xiàng)
1.有 LLM 相關(guān)上線經(jīng)驗(yàn)
2.參與過大規(guī)模分布式系統(tǒng)架構(gòu)設(shè)計(jì)
3.了解模型推理服務(wù)(vLLM、TensorRT-LLM 等)