崗位職責(zé):
1. 開(kāi)展基于團(tuán)隊(duì)自研的數(shù)據(jù)系統(tǒng)的研發(fā)(圖數(shù)據(jù)庫(kù)、向量數(shù)據(jù)庫(kù)等),參與公司自研的向量數(shù)據(jù)庫(kù)核心模塊的設(shè)計(jì)、開(kāi)發(fā)與性能優(yōu)化,重點(diǎn)涵蓋查詢執(zhí)行器、索引管理、實(shí)現(xiàn)高性能向量檢索算法(HNSW、IVF-PQ、ScaNN、DiskANN 等)等。
2. 探索向量數(shù)據(jù)庫(kù)與傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)融合的多模態(tài)數(shù)據(jù)庫(kù)架構(gòu),設(shè)計(jì)下一代多模態(tài)數(shù)據(jù)庫(kù)架構(gòu)。
3. 開(kāi)展大語(yǔ)言模型的應(yīng)用設(shè)計(jì)與開(kāi)發(fā),包括 RAG、Agent等核心場(chǎng)景。
4. 基于國(guó)產(chǎn)硬件平臺(tái)與團(tuán)隊(duì)自研的國(guó)產(chǎn)數(shù)據(jù)系統(tǒng)設(shè)計(jì)端到端的數(shù)據(jù)智能應(yīng)用,涵蓋模型推理服務(wù)、知識(shí)檢索、記憶緩存與用戶交互方式。
5. 結(jié)合業(yè)務(wù)需求,設(shè)計(jì)數(shù)據(jù)流、提示鏈與工具調(diào)用鏈,持續(xù)優(yōu)化數(shù)據(jù)服務(wù)的生成質(zhì)量與效率。
6. 與模型團(tuán)隊(duì)、后端開(kāi)發(fā)團(tuán)隊(duì)協(xié)同,完成自研數(shù)據(jù)智能應(yīng)用的國(guó)產(chǎn)化應(yīng)用落地,并持續(xù)優(yōu)化應(yīng)用運(yùn)行情況。
7. 持續(xù)跟蹤開(kāi)源與商業(yè)的LLM應(yīng)用生態(tài),評(píng)估并引入適合的框架或工具。
崗位要求:
1. 計(jì)算機(jī)、軟件工程或相關(guān)專業(yè)碩士或博士,計(jì)算機(jī)體系結(jié)構(gòu)、操作系統(tǒng)等基本功扎實(shí)。
2. 深刻理解大語(yǔ)言模型的工作原理(Transformer、RAG Pipeline 等),熟悉多輪對(duì)話、工具調(diào)用、長(zhǎng)文本擴(kuò)寫等場(chǎng)景的架構(gòu)模式。
3. 精通Python、C++或者Java語(yǔ)言,熟悉 LangChain / LlamaIndex / FastAPI 等框架進(jìn)行快速迭代與部署。
4. 熟悉常見(jiàn)數(shù)據(jù)系統(tǒng):關(guān)系型(PostgreSQL、MySQL)、NoSQL(Redis、RocksDB)、向量(Milvus、Qdrant)、圖(Neo4j、Nebula Graph)、大數(shù)據(jù)處理(Hadoop、Spark),具備良好的數(shù)據(jù)建模能力。
5. 深入理解數(shù)據(jù)庫(kù)內(nèi)核原理,包括存儲(chǔ)管理、查詢優(yōu)化器、事務(wù)與日志、多版本并發(fā)控制等。有參與或貢獻(xiàn)開(kāi)源數(shù)據(jù)庫(kù)經(jīng)驗(yàn)者優(yōu)先。
6. 了解主流向量數(shù)據(jù)庫(kù)(Milvus、Weaviate、FAISS、Qdrant 等)并能進(jìn)行性能調(diào)優(yōu)。
7. 邏輯清晰,結(jié)果導(dǎo)向,具有良好的文檔編寫能力,具備跨團(tuán)隊(duì)溝通協(xié)作,熱愛(ài)探索學(xué)習(xí)前沿大模型應(yīng)用技術(shù);有生成式 AI 產(chǎn)品落地經(jīng)驗(yàn)者優(yōu)先。