崗位職責:
建設統(tǒng)一可觀測性體系,包括監(jiān)控、日志、鏈路追蹤、APM
設計和實施SLI/SLO指標體系,建立業(yè)務健康度量標準
開發(fā)智能運維工具,包括異常檢測、故障預測、根因分析
負責多云監(jiān)控數(shù)據(jù)集成和可視化展示
實施告警優(yōu)化和智能降噪,提升故障發(fā)現(xiàn)效率
任職要求:
本科及以上學歷,計算機相關專業(yè),3-5年監(jiān)控或可觀測性經(jīng)驗
精通Prometheus、Grafana、ELK、Jaeger等可觀測性工具棧
具備強大的腳本開發(fā)能力,熟悉Python、Go、Shell等
熟悉時序數(shù)據(jù)庫和大數(shù)據(jù)處理技術
具備數(shù)據(jù)分析和機器學習基礎知識
良好的數(shù)據(jù)可視化和報表開發(fā)能力
Onsite易點天下,外企七險一金,15天年假,試用期100%薪資