【崗位定位】
作為公司視覺技術(shù)線的研發(fā)人員,負責面向能源、設(shè)計院、教育等行業(yè)的機器視覺及圖紙識別算法研發(fā)與落地,將先進的CV技術(shù)與具體業(yè)務(wù)場景(如工業(yè)巡檢、行為檢測、圖紙矢量化、文檔理解等)相結(jié)合,打造高精度、高可用的AI解決方案。
【崗位職責】
1. 算法研發(fā)與創(chuàng)新 (50%)
- 核心方向一(機器視覺): 負責工業(yè)場景下的目標檢測、缺陷檢測、行為識別等算法研發(fā)。
- 核心方向二(圖紙識別/文檔理解): 負責工程設(shè)計圖、建筑圖紙、流程圖等復雜文檔的結(jié)構(gòu)化識別算法研發(fā),包括但不限于圖形分割、符號識別、文字檢測與識別、拓撲關(guān)系重建等。
- 跟蹤前沿CV技術(shù)(如多模態(tài)大模型、視覺Transformer、小樣本學習等),并結(jié)合業(yè)務(wù)場景進行技術(shù)預(yù)研與落地轉(zhuǎn)化。
2. 工程化落地與優(yōu)化 (30%)
- 負責算法的模型壓縮、加速及端側(cè)/邊緣側(cè)部署,確保算法在實際硬件環(huán)境下的實時性與穩(wěn)定性。
- 參與AI中臺的視覺能力建設(shè),將通用視覺能力標準化、服務(wù)化,供上層應(yīng)用調(diào)用。
- 針對長尾/疑難樣本進行Bad Case分析,持續(xù)迭代優(yōu)化模型效果。
3. 項目支持與協(xié)作 (20%)
- 配合售前團隊進行技術(shù)可行性評估,參與POC測試,提供算法層面的專業(yè)判斷。
- 與后端工程師、產(chǎn)品經(jīng)理及項目技術(shù)經(jīng)理緊密協(xié)作,確保算法模塊能夠順利集成到完整的解決方案中。
- 編寫算法設(shè)計文檔、接口文檔及模型訓練部署指南,沉淀技術(shù)資產(chǎn)。
【任職要求】
1. 硬性技能與經(jīng)驗
- 學歷專業(yè): 統(tǒng)招碩士及以上學歷(優(yōu)秀本科可視情況放寬),計算機、自動化、數(shù)學、光學工程等相關(guān)專業(yè)。
- 基礎(chǔ)能力: 扎實的編程功底,精通Python/C++;熟練掌握PyTorch、TensorFlow等至少一種主流深度學習框架。
- CV基礎(chǔ): 深刻理解圖像分類、目標檢測、圖像分割、OCR、關(guān)鍵點檢測等經(jīng)典任務(wù)的原理與主流算法(如YOLO系列、ResNet、Transformer、GAN等)。
- 項目經(jīng)驗: 至少主導或核心參與過2個以上視覺算法的實際落地項目。
- 有工業(yè)視覺/缺陷檢測項目經(jīng)驗者優(yōu)先,熟悉打光、成像系統(tǒng)、數(shù)據(jù)增強等工程技巧。
- 有文檔理解/圖紙識別項目經(jīng)驗者優(yōu)先,熟悉OCR全流程(檢測+識別+結(jié)構(gòu)化)、表格識別、圖表解析等技術(shù)棧。
2. 工程化能力
- 模型優(yōu)化: 熟悉模型剪枝、量化、蒸餾等模型壓縮技術(shù),有ONNX、TensorRT、OpenVINO等推理加速工具的實際使用經(jīng)驗。
- 部署經(jīng)驗: 熟悉Linux環(huán)境開發(fā),有Docker容器化部署經(jīng)驗;了解邊緣計算設(shè)備(如Jetson系列)的部署流程。
- 數(shù)據(jù)處理: 具備較強的數(shù)據(jù)清洗、標注規(guī)范制定及數(shù)據(jù)增強能力,能從數(shù)據(jù)層面提升模型效果。
3. 軟素質(zhì)與加分項
- 業(yè)務(wù)理解力: 對能源、設(shè)計院、醫(yī)療等行業(yè)的視覺應(yīng)用場景有好奇心,能主動深入業(yè)務(wù),理解客戶真實痛點,而非僅停留在技術(shù)層面。
- 問題解決能力: 面對復雜場景和臟亂數(shù)據(jù),能冷靜分析、快速迭代,具備極強的抗壓能力和攻堅精神。
- 學習能力: 對新技術(shù)(如多模態(tài)大模型、視覺生成模型)保持敏感,并能快速學習應(yīng)用到實際工作中。