崗位職責(zé):
1、負責(zé)公司應(yīng)用系統(tǒng)的日常部署、啟停、配置變更及定期巡檢,保障系統(tǒng)7×24小時穩(wěn)定運行,及時發(fā)現(xiàn)并處理各類運行隱患。
2、負責(zé)Redis、RabbitMQ、Kafka、ELK等各類中間件的搭建、部署、配置優(yōu)化及日常運維,確保中間件服務(wù)正常支撐業(yè)務(wù)運轉(zhuǎn);
3、快速響應(yīng)故障告警,精準定位應(yīng)用、中間件、數(shù)據(jù)庫等層面的故障根源,協(xié)同開發(fā)、測試等團隊高效完成故障恢復(fù),事后完成復(fù)盤并落地優(yōu)化措施;
4、搭建并維護系統(tǒng)性能監(jiān)控體系,定期分析系統(tǒng)運行指標與性能瓶頸,推進應(yīng)用及基礎(chǔ)設(shè)施的性能優(yōu)化,提升系統(tǒng)承載能力與用戶體驗;
5、規(guī)范并優(yōu)化運維流程,編寫、更新運維手冊、應(yīng)急預(yù)案、配置清單等各類文檔;協(xié)同開發(fā)、業(yè)務(wù)團隊,提供運維層面技術(shù)支持,配合完成系統(tǒng)上線、測試及業(yè)務(wù)需求落地等工作。"
任職要求:
1、熟練掌握Linux(CentOS/Ubuntu/Redhat)操作系統(tǒng)的安裝、配置、運維及故障排查,熟悉常用命令;具備基礎(chǔ)網(wǎng)絡(luò)知識,了解TCP/IP協(xié)議,能排查簡單網(wǎng)絡(luò)問題;
2、熟悉Tomcat、Nginx等Web服務(wù)器,Redis、ELK、MQ等各類中間件及數(shù)據(jù)庫的部署、配置、備份恢復(fù)及故障處理;熟練掌握各類中間件的搭建與運維工作;
3、熟悉阿里云或華為云等主流云平臺的產(chǎn)品使用與運維,能熟練操作云服務(wù)器、負載均衡、存儲等核心產(chǎn)品;
4、具備容器化技術(shù)(Docker)實操經(jīng)驗,熟練掌握K8s集群的搭建、維護、調(diào)度及故障排查,能保障容器集群穩(wěn)定運行;
5、熟悉Jenkins等CI/CD工具、Prometheus、Grafana等監(jiān)控工具及Ansible等自動化運維工具,具備基礎(chǔ)的Shell/Python腳本編寫能力;
6、備良好的溝通協(xié)調(diào)能力、問題分析與解決能力,工作嚴謹負責(zé),有較強的責(zé)任心、抗壓能力及團隊合作意識。
7、具備大型分布式應(yīng)用系統(tǒng)運維經(jīng)驗者優(yōu)先;持有相關(guān)運維認證(如RHCE、阿里云ACP等)者優(yōu)先。"