崗位職責:
1. 開展基于團隊自研的數(shù)據(jù)系統(tǒng)的研發(fā)(圖數(shù)據(jù)庫、向量數(shù)據(jù)庫等),參與公司自研的向量數(shù)據(jù)庫核心模塊的設計、開發(fā)與性能優(yōu)化,重點涵蓋查詢執(zhí)行器、索引管理、實現(xiàn)高性能向量檢索算法(HNSW、IVF-PQ、ScaNN、DiskANN 等)等。
2. 探索向量數(shù)據(jù)庫與傳統(tǒng)關系型數(shù)據(jù)庫、圖數(shù)據(jù)庫融合的多模態(tài)數(shù)據(jù)庫架構,設計下一代多模態(tài)數(shù)據(jù)庫架構。
3. 開展大語言模型的應用設計與開發(fā),包括 RAG、Agent等核心場景。
4. 基于國產(chǎn)硬件平臺與團隊自研的國產(chǎn)數(shù)據(jù)系統(tǒng)設計端到端的數(shù)據(jù)智能應用,涵蓋模型推理服務、知識檢索、記憶緩存與用戶交互方式。
5. 結(jié)合業(yè)務需求,設計數(shù)據(jù)流、提示鏈與工具調(diào)用鏈,持續(xù)優(yōu)化數(shù)據(jù)服務的生成質(zhì)量與效率。
6. 與模型團隊、后端開發(fā)團隊協(xié)同,完成自研數(shù)據(jù)智能應用的國產(chǎn)化應用落地,并持續(xù)優(yōu)化應用運行情況。
7. 持續(xù)跟蹤開源與商業(yè)的LLM應用生態(tài),評估并引入適合的框架或工具。
崗位要求:
1. 計算機、軟件工程或相關專業(yè)碩士或博士,計算機體系結(jié)構、操作系統(tǒng)等基本功扎實。
2. 深刻理解大語言模型的工作原理(Transformer、RAG Pipeline 等),熟悉多輪對話、工具調(diào)用、長文本擴寫等場景的架構模式。
3. 精通Python、C++或者Java語言,熟悉 LangChain / LlamaIndex / FastAPI 等框架進行快速迭代與部署。
4. 熟悉常見數(shù)據(jù)系統(tǒng):關系型(PostgreSQL、MySQL)、NoSQL(Redis、RocksDB)、向量(Milvus、Qdrant)、圖(Neo4j、Nebula Graph)、大數(shù)據(jù)處理(Hadoop、Spark),具備良好的數(shù)據(jù)建模能力。
5. 深入理解數(shù)據(jù)庫內(nèi)核原理,包括存儲管理、查詢優(yōu)化器、事務與日志、多版本并發(fā)控制等。有參與或貢獻開源數(shù)據(jù)庫經(jīng)驗者優(yōu)先。
6. 了解主流向量數(shù)據(jù)庫(Milvus、Weaviate、FAISS、Qdrant 等)并能進行性能調(diào)優(yōu)。
7. 邏輯清晰,結(jié)果導向,具有良好的文檔編寫能力,具備跨團隊溝通協(xié)作,熱愛探索學習前沿大模型應用技術;有生成式 AI 產(chǎn)品落地經(jīng)驗者優(yōu)先。