職位描述
---負(fù)責(zé)公司云平臺(tái)(阿里云等)的架構(gòu)設(shè)計(jì)、部署、監(jiān)控及日常運(yùn)維,保障系統(tǒng)高可用性和穩(wěn)定性。
---設(shè)計(jì)并實(shí)施自動(dòng)化運(yùn)維方案(CI/CD、IaC),提升運(yùn)維效率,降低人為故障風(fēng)險(xiǎn)。
---建立和完善監(jiān)控告警體系(如Prometheus、Zabbix、云監(jiān)控等),快速定位并解決故障。
---制定和執(zhí)行信息安全策略,包括漏洞掃描、權(quán)限管理、攻防演練等,確保系統(tǒng)符合安全合規(guī)要求。
---參與容量規(guī)劃、性能優(yōu)化及災(zāi)難恢復(fù)方案設(shè)計(jì),應(yīng)對(duì)高并發(fā)場(chǎng)景和突發(fā)流量。
---編寫運(yùn)維文檔,推動(dòng)運(yùn)維標(biāo)準(zhǔn)化,并協(xié)助開發(fā)團(tuán)隊(duì)優(yōu)化應(yīng)用架構(gòu)。
任職要求
--2年以上運(yùn)維/SRE經(jīng)驗(yàn),精通騰訊云\阿里云產(chǎn)品(ECS、SLB、RDS、OSS、VPC等)及運(yùn)維操作。
--熟悉Linux系統(tǒng)管理、網(wǎng)絡(luò)原理(TCP/IP、DNS、HTTP等)及常見中間件(Nginx、MySQL、Redis等)。
--掌握自動(dòng)化運(yùn)維工具(Ansible/Terraform/Puppet等)和腳本語言(Shell/Python/Go等)。
--具備信息安全意識(shí),熟悉防火墻、WAF、IDS/IPS、數(shù)據(jù)加密等安全防護(hù)手段。
--有監(jiān)控系統(tǒng)搭建經(jīng)驗(yàn)(如Prometheus+Grafana、ELK等),熟悉日志分析和性能調(diào)優(yōu)。
加分項(xiàng)
--阿里云相關(guān)認(rèn)證(如ACP/ACE)、CISSP/CISP等安全認(rèn)證。
--熟悉Kubernetes、Docker等容器化技術(shù)及微服務(wù)運(yùn)維。
--有大規(guī)模集群、高并發(fā)系統(tǒng)或金融級(jí)穩(wěn)定性保障經(jīng)驗(yàn)。
--熟悉DevOps理念,有Jenkins/GitLab CI等流水線設(shè)計(jì)經(jīng)驗(yàn)。