崗位職責(zé):
(1) 負(fù)責(zé)或參與PCIe、RDMA、UCIe等互連技術(shù)的驅(qū)動(dòng)程序和中間件開(kāi)發(fā)。
(2) 設(shè)計(jì)GPU/vGPU的資源優(yōu)化方案,負(fù)責(zé)GPU切分、GPU算力池化等技術(shù),使之滿足訓(xùn)練、推理等場(chǎng)景下GPU虛擬化、集群需求
(3) 負(fù)責(zé)或參與芯片的驅(qū)動(dòng)適配、調(diào)試以及移植工作
(4) 撰寫(xiě)和維護(hù)相關(guān)的技術(shù)文檔、設(shè)計(jì)文稿以及單元測(cè)試
任職要求:
(1) 計(jì)算機(jī)、電子工程、微電子等相關(guān)專業(yè),本科及以上學(xué)歷,5年以上工作經(jīng)驗(yàn)
(2) 熟悉Hypervisor層等虛擬化關(guān)鍵技術(shù),精通KVM/QEMU/Libvirt虛擬化技術(shù)棧,熟悉PCIe、CCIX、CXL
(3) 熟悉NCCL的工作原理和工作流程,熟悉CUDA/OPENCL
(4) 熟悉GPU硬件架構(gòu)(SM/Tensor Core),能分析CUDA性能瓶頸
(5) 熟悉Docker等容器技術(shù),了解Nvidia-Docker技術(shù),了解k8s以及相關(guān)云原生體系技術(shù)
(6) 有AI芯片或者GPGPU的片內(nèi)/片間互聯(lián)相關(guān)軟件棧開(kāi)發(fā)經(jīng)驗(yàn)者優(yōu)先