職位:CV視覺算法工程師
崗位職責:
參與公司計算機視覺算法的設(shè)計、開發(fā)與優(yōu)化,涵蓋目標檢測、圖像分割、OCR識別、圖像分類等核心視覺任務的算法研發(fā)與迭代;
負責基于YOLO系列(YOLOv5/v8/v11/YOLOX等)、RT-DETR等主流檢測框架的模型選型、訓練調(diào)優(yōu)與部署落地;
參與視覺大模型(VLM)相關(guān)工作,包括視覺編碼器(ViT、SigLIP、InternViT等)的微調(diào)與適配、視覺-語言對齊模塊的優(yōu)化(如MLP Projector、Cross-Attention Bridge等);
負責視覺數(shù)據(jù)Pipeline的構(gòu)建與維護,包括數(shù)據(jù)采集、清洗、標注管理(Labelme/CVAT等)、數(shù)據(jù)增強策略設(shè)計與質(zhì)量控制;
參與模型的工程化部署與推理優(yōu)化,包括使用ONNX Runtime、TensorRT、OpenVINO等框架進行模型量化、剪枝及端側(cè)/服務端推理加速;
基于OpenCV、Pillow等工具完成圖像預處理、后處理及傳統(tǒng)視覺算法(形態(tài)學操作、輪廓檢測、模板匹配等)的開發(fā)與集成;
跟蹤學術(shù)界與工業(yè)界在目標檢測、視覺大模型、多模態(tài)理解等方向的前沿進展,并在團隊內(nèi)進行分享與落地探索;
配合產(chǎn)品與工程團隊完成視覺算法方案的聯(lián)調(diào)、測試與迭代。
任職資格:
計算機科學、人工智能、電子信息、自動化等相關(guān)專業(yè)本科及以上學歷;
熟練掌握Python和C++,具備良好的編程習慣和代碼能力;
掌握深度學習基礎(chǔ)理論,熟悉CNN、Transformer等主干網(wǎng)絡架構(gòu)原理(卷積操作、注意力機制、FPN/PAN特征融合等核心概念);
熟練使用OpenCV進行圖像處理與分析,具備扎實的傳統(tǒng)視覺算法功底;
對YOLO系列檢測框架有深入理解和實際項目經(jīng)驗,熟悉Anchor-Free/Anchor-Based檢測范式、NMS后處理、多尺度檢測等關(guān)鍵技術(shù);
對視覺大模型(VLM)架構(gòu)有了解或?qū)嵺`經(jīng)驗,理解視覺編碼器(ViT、SigLIP等)的工作原理,了解視覺Token化、圖像分辨率適配(Dynamic Resolution、AnyRes等)策略者優(yōu)先;
熟悉PyTorch等主流深度學習框架,有MMDetection、Ultralytics、Detectron2等檢測工具鏈使用經(jīng)驗者優(yōu)先;
具備良好的文獻閱讀能力和自驅(qū)學習習慣,能夠快速理解并復現(xiàn)前沿工作;
有天池競賽、CVPR/ECCV/ICCV等頂會論文發(fā)表、開源項目貢獻經(jīng)驗者優(yōu)先。
加分項:
有模型部署實戰(zhàn)經(jīng)驗(TensorRT、ONNX、TFLite等),熟悉從訓練到上線的完整鏈路
有多模態(tài)大模型相關(guān)研究或項目經(jīng)驗(如Qwen-VL、InternVL、LLaVA等模型的訓練或微調(diào))
有實際視覺應用落地經(jīng)驗(如工業(yè)質(zhì)檢、自動駕駛感知、安防監(jiān)控等場景)