招聘對(duì)象: 2026屆應(yīng)屆碩士生,專業(yè)對(duì)口。應(yīng)屆生(計(jì)算機(jī)科學(xué)、人工智能、軟件工程等相關(guān)專業(yè))
【崗位職責(zé)】
1.負(fù)責(zé)編制、審核AI算力集群硬件設(shè)備配置方案,編制IT總體設(shè)計(jì)方案及部署實(shí)施方案;
2.負(fù)責(zé)算力硬件設(shè)備的上架、部署、測(cè)試、配置與故障檢測(cè);
3.負(fù)責(zé)算力集群的網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)與實(shí)施,維護(hù)、優(yōu)化集群的標(biāo)準(zhǔn)化配置基線;
4.負(fù)責(zé)算力集群ROCE、InfiniBand網(wǎng)絡(luò)的配置、調(diào)優(yōu)與性能監(jiān)控,確保高帶寬、低延遲通信性能;
5.負(fù)責(zé)國(guó)產(chǎn)化高性能硬件設(shè)備(如國(guó)產(chǎn)CPU、GPU、網(wǎng)絡(luò)與存儲(chǔ)設(shè)備等)的基礎(chǔ)配置與測(cè)試驗(yàn)證;
6.參與AI算力資源池的構(gòu)建與管理,支持AI模型訓(xùn)練、推理及高性能計(jì)算任務(wù)的資源調(diào)度;
【任職要求】
1.學(xué)歷背景:計(jì)算機(jī)科學(xué)、人工智能、軟件工程等相關(guān)專業(yè), 2026屆應(yīng)屆碩士生
2.熟悉服務(wù)器、網(wǎng)絡(luò)及存儲(chǔ)設(shè)備的安裝、配置與維護(hù),具備扎實(shí)的Linux系統(tǒng)運(yùn)維能力;
3.熟悉GPU服務(wù)器體系結(jié)構(gòu),了解NVIDIA、華為昇騰、寒武紀(jì)等主流算力架構(gòu)及GPU加速卡特性;
4.熟悉ROCE、InfiniBand網(wǎng)絡(luò)與調(diào)優(yōu)方法,掌握RDMA通信原理及網(wǎng)絡(luò)性能監(jiān)測(cè)工具;
5.熟悉CUDA、cuDNN、NCCL等AI計(jì)算框架底層組件,具備PyTorch、TensorFlow等深度學(xué)習(xí)框架運(yùn)行環(huán)境配置經(jīng)驗(yàn);
6.熟悉國(guó)產(chǎn)化硬件與操作系統(tǒng)的基礎(chǔ)配置與兼容性調(diào)優(yōu)。