核心職責(zé): 1. 設(shè)計(jì)并實(shí)施監(jiān)控、告警系統(tǒng),確保及時(shí)發(fā)現(xiàn)問(wèn)題。 2. 制定 SLA/SLO(服務(wù)等級(jí)目標(biāo))/SLI(服務(wù)等級(jí)指標(biāo)),并圍繞這些指標(biāo)優(yōu)化系統(tǒng)。 3. 處理事故(Incident Management),進(jìn)行根因分析(RCA)并推動(dòng)改進(jìn)。 4. 通過(guò)自動(dòng)化減少人工操作(如自動(dòng)擴(kuò)縮容、故障自愈)。 5. 容量規(guī)劃與性能優(yōu)化,確保系統(tǒng)可應(yīng)對(duì)流量增長(zhǎng)。 6. GitOps CI/CD流水線設(shè)計(jì)與實(shí)施 l 設(shè)計(jì)并搭建基于GitOps理念的自動(dòng)化CI/CD流水線,集成Kubernetes、ArgoCD、Tekton等工具。 l 實(shí)現(xiàn)代碼從提交到部署的全流程自動(dòng)化,確保環(huán)境一致性及可追溯性。 l 優(yōu)化流水線性能,提升構(gòu)建、測(cè)試、部署效率。 7. DevOps工具鏈整合 l 將CI/CD系統(tǒng)與JIRA等敏捷管理工具深度整合,實(shí)現(xiàn)需求-開(kāi)發(fā)-部署-運(yùn)維閉環(huán)。 l 與企業(yè)微信集成,支持一鍵部署各集成環(huán)境(如開(kāi)發(fā)、測(cè)試、預(yù)發(fā)布、生產(chǎn))。 l 通過(guò)自動(dòng)化腳本(Python/Shell)打通工具鏈數(shù)據(jù)流,提供可視化度量指標(biāo)(如部署頻率、故障恢復(fù)時(shí)間)。 8. 技術(shù)開(kāi)發(fā)與自動(dòng)化 l 使用Python開(kāi)發(fā)運(yùn)維工具、自動(dòng)化腳本及API集成模塊,支持運(yùn)維效率提升。 l 探索AI工具(如GitHub Copilot、LLM)在日志分析、故障排查、代碼生成等場(chǎng)景的應(yīng)用。 9. 運(yùn)維架構(gòu)優(yōu)化與規(guī)范制定 l 設(shè)計(jì)高可用、可擴(kuò)展的基礎(chǔ)設(shè)施架構(gòu),制定運(yùn)維規(guī)范及災(zāi)備方案。 l 推動(dòng)Infrastructure as Code(IaC)實(shí)踐,熟練使用Terraform、Ansible等工具。
任職要求: 1. 必備條件: l 3年以上運(yùn)維開(kāi)發(fā)或DevOps相關(guān)經(jīng)驗(yàn),熟悉云原生技術(shù)棧(K8s/Docker/Helm)。 l 精通GitOps實(shí)踐,有ArgoCD/Flux等工具的實(shí)際項(xiàng)目經(jīng)驗(yàn)。 l 熟練使用Python開(kāi)發(fā),具備腳本編寫(xiě)、API集成及自動(dòng)化開(kāi)發(fā)能力。 l 熟悉JIRA API及敏捷開(kāi)發(fā)流程,能設(shè)計(jì)工具鏈整合方案。 l 具有企業(yè)微信API集成經(jīng)驗(yàn),能夠?qū)崿F(xiàn)CI/CD與企業(yè)微信的自動(dòng)化交互(如審批、通知、一鍵部署)。 l 善于學(xué)習(xí)新技術(shù),能主動(dòng)運(yùn)用AI工具輔助工作。 2. 優(yōu)先條件: l 有保險(xiǎn)、金融行業(yè)DevOps平臺(tái)建設(shè)經(jīng)驗(yàn)。 l 熟悉Prometheus/Grafana監(jiān)控體系或日志分析工具(ELK)。 l 持有Kubernetes/CKA、AWS/Azure認(rèn)證者加分。 l 會(huì)粵語(yǔ)者優(yōu)先