職位描述: "1. 負責(zé)核心服務(wù)監(jiān)控告警異常、共性反饋的Oncall和應(yīng)急響應(yīng) 2. 負責(zé)故障的全流程生命周期管理 3. 負責(zé)故障數(shù)據(jù)分析和總結(jié)并對外同步 4. 負責(zé)推動穩(wěn)定性各項規(guī)范和流程的落地以及日常運營"
職位要求: "1. 本科及以上學(xué)歷,計算機相關(guān)專業(yè); 2. 1~3年相關(guān)領(lǐng)域工作經(jīng)驗,有扎實的計算機軟件基礎(chǔ)知識,了解 Linux 操作系統(tǒng)、存儲、網(wǎng)絡(luò) IO 等相關(guān)原理; 3. 熟悉一種或多種編程語言,例如 Python/Go/Java/Shell/Ansible; 4. 具備系統(tǒng)化解決問題的能力,良好的溝通技巧和主人翁責(zé)任感; 5. 具有相關(guān)計算/分布式/大數(shù)據(jù)等系統(tǒng)經(jīng)驗優(yōu)先,如Kubernetes/Docker/Spark/Flink 等; 6. 具有算法思維,良好的數(shù)據(jù)結(jié)構(gòu)和系統(tǒng)設(shè)計的能力者優(yōu)先"