崗位職責(zé)
1. 負(fù)責(zé)深度學(xué)習(xí)模型在邊緣 / 端側(cè)設(shè)備上的工程化落地、推理優(yōu)化與全流程部署;
2. 完成模型量化、剪枝、知識蒸餾等壓縮與加速工作,在精度與性能間做最優(yōu)平衡;
3. 熟悉主流 AI 部署工具鏈,完成模型轉(zhuǎn)換、解析、優(yōu)化、編譯與集成調(diào)試。
4. 負(fù)責(zé)將模型部署到邊緣計算處理器(ARM/RISC-V/NPU/DSP 等),定位并解決推理性能、精度、兼容性問題。
5. 與算法、硬件、產(chǎn)品團(tuán)隊協(xié)同,輸出部署方案、性能指標(biāo)與技術(shù)文檔。
任職要求
1. 本科及以上學(xué)歷,計算機(jī)、自動化、電子信息、AI 相關(guān)專業(yè),三年及以上 AI 模型部署 / 模型應(yīng)用工程相關(guān)工作經(jīng)驗;
2. 精通 PyTorch/TensorFlow 至少一種主流深度學(xué)習(xí)框架,深入理解模型結(jié)構(gòu)、計算圖與推理流程;
3. 熟練掌握模型量化(INT8/FP16)、剪枝、知識蒸餾等壓縮加速技術(shù),有大規(guī)模業(yè)務(wù)落地與調(diào)優(yōu)經(jīng)驗。
4. 精通主流 AI 部署工具鏈:ONNX、TensorRT、TFLite、OpenVINO、MNN、NCNN、Tengine 等至少三種,能獨立完成模型全鏈路優(yōu)化。
5. 具備豐富的邊緣計算處理器部署經(jīng)驗,熟悉 Linux 環(huán)境、C++/Python 開發(fā)與復(fù)雜問題調(diào)試。
6 . 具備較強(qiáng)的架構(gòu)設(shè)計能力、問題定位能力、工程規(guī)范意識與跨團(tuán)隊協(xié)作能力。
7. 有 NPU、DSP、邊緣 AI 芯片部署與深度優(yōu)化經(jīng)驗優(yōu)先。