【崗位背景與定位】
專注于特定垂直領域的知識圖譜構建,通過開源情報(OSINT) 途徑獲取多源異構數(shù)據(jù),帶領團隊從零到一搭建一套具備強大的本體建模能力、高效的實體抽取能力以及復雜的邏輯推理能力的知識圖譜庫。
【崗位職責】
1. 技術戰(zhàn)略與架構設計 (40%)
頂層設計: 負責面向特定領域的知識圖譜整體技術架構設計,包括數(shù)據(jù)層、存儲層、計算層和應用層的技術選型與路線規(guī)劃。
本體工程: 主導特定領域的本體(Ontology)設計與構建,定義符合業(yè)務邏輯的類、屬性、關系及約束規(guī)則,確保知識表達的規(guī)范性與完備性。
推理引擎規(guī)劃: 設計并實現(xiàn)基于規(guī)則或基于統(tǒng)計學習的推理引擎,支持基于現(xiàn)有知識的邏輯演繹、一致性校驗及隱含知識的挖掘。
2. 研發(fā)攻堅與落地 (40%)
開源情報獲取與治理: 指導團隊利用爬蟲、API接口、文檔解析等技術,從開源情報(如互聯(lián)網(wǎng)公開數(shù)據(jù)、專業(yè)報告、學術文獻、新聞等)中高效獲取數(shù)據(jù),并解決數(shù)據(jù)清洗、去噪、對齊等難題。
知識抽取與融合: 帶領團隊攻克非結構化/半結構化文本中的實體識別(NER)、關系抽?。≧E)、事件抽取等技術難點,實現(xiàn)多源異構知識的實體對齊與融合。
圖數(shù)據(jù)庫與計算: 負責圖數(shù)據(jù)庫(如Neo4j, JanusGraph, Nebula等)的選型與優(yōu)化,實現(xiàn)海量知識的高效存儲與查詢,并開發(fā)基于圖算法的分析應用。
3. 團隊管理與賦能 (20%)
項目管理: 制定合理的研發(fā)排期,把控項目進度,確保知識圖譜庫的迭代更新與質量。
技術傳承: 建立內部技術文檔體系,組織技術分享,培養(yǎng)團隊成員的技術能力。
【任職要求】
1. 數(shù)學、人工智能、情報學等相關專業(yè)碩士及以上學歷,博士優(yōu)先。
2. 5年以上人工智能、自然語言處理或知識圖譜相關研發(fā)經(jīng)驗,其中至少2年技術團隊管理經(jīng)驗。
3. 對知識圖譜全生命周期技術有深入理解,尤其精通本體建模(Ontology Modeling) 和知識推理(Knowledge Reasoning) 的理論與實踐。
4. 熟悉傳統(tǒng)的NLP技術和基于深度學習(BERT、GPT系列等)的預訓練模型,對信息抽取有豐富的實戰(zhàn)經(jīng)驗。
5. 精通Python/Java,具備扎實的代碼功底和良好的工程化習慣。
6. 熟悉圖數(shù)據(jù)庫(如Neo4j)及向量數(shù)據(jù)庫的原理與應用,對RDF、OWL等知識表示標準有深入了解者優(yōu)先。
7. 熟悉大數(shù)據(jù)處理框架(如Spark、Flink)者優(yōu)先。
8. 對開源情報(OSINT) 工作有深刻理解,熟悉各類開源數(shù)據(jù)源的特點,具備從海量噪音中提取高價值情報的敏感度。對特定垂直領域(如J事、安全)有深入研究者優(yōu)先。
9. 具備優(yōu)秀的邏輯思維能力和文檔撰寫能力,能將復雜的技術邏輯清晰地傳達給非技術人員。
【加分項】
1. 在頂級會議發(fā)表過知識圖譜或NLP相關論文者。
2. 有構建千萬級以上節(jié)點規(guī)模、支持邏輯推理的工業(yè)級知識圖譜系統(tǒng)經(jīng)驗者。
3. 熟悉情報分析流程,或有軍民融合項目經(jīng)驗者。