崗位職責:
1、負責騰訊云基礎(chǔ)設(shè)施的監(jiān)控、巡檢及故障處理,保障業(yè)務(wù)7×24小時穩(wěn)定運行;
2、管理云資源生命周期,包括資源申請、配置變更、容量規(guī)劃及成本優(yōu)化;
3、設(shè)計并落地運維自動化方案,基于騰訊云API、Terraform、Ansible、Shell/Python等工具實現(xiàn)資源編排、部署流程自動化,提升運維效率;
4、搭建監(jiān)控告警體系,整合騰訊云監(jiān)控(Cloud Monitor)、Prometheus、Grafana等工具,覆蓋資源指標、應(yīng)用性能及業(yè)務(wù)日志;
5、落實騰訊云安全最佳實踐,配置安全組、WAF、堡壘機、數(shù)據(jù)加密(SSL/TLS、KMS)等防護措施,定期進行漏洞掃描與安全審計;
6、對接開發(fā)、產(chǎn)品團隊,提供云資源使用咨詢與技術(shù)支持,推動運維需求標準化;
7、與新項目的云架構(gòu)評審,從運維視角提出優(yōu)化建議。
任職要求:
1、本科及以上學(xué)歷,計算機、軟件工程等相關(guān)專業(yè);
2、3年以上云平臺運維經(jīng)驗,其中至少1年騰訊云深度使用經(jīng)驗(熟悉阿里云/華為云者可酌情考慮,但需快速掌握騰訊云特性);
3、持有騰訊云高級工程師認證(TCP) 、AWS Certified SysOps Administrator或CKA(Certified Kubernetes Administrator)認證者優(yōu)先;
4、騰訊云核心產(chǎn)品:精通CVM、VPC、CLB、CDB(MySQL/Redis)、COS、TKE、云監(jiān)控等產(chǎn)品的配置、調(diào)優(yōu)及故障處理,熟悉騰訊云賬號體系(CAM權(quán)限管理)、資源標簽與成本分析工具(Cost Explorer);
5、運維自動化:熟練使用Terraform編寫IaC(基礎(chǔ)設(shè)施即代碼),掌握Ansible/Shell/Python(至少一種)實現(xiàn)批量操作與腳本編寫;
6、底層技術(shù):熟悉Linux系統(tǒng)(CentOS/Ubuntu)運維,掌握內(nèi)核調(diào)優(yōu)、網(wǎng)絡(luò)排障(tcpdump/iftop)、存儲管理(LVM/RAID),了解Docker容器化、Kubernetes編排原理;
7、監(jiān)控與排障:掌握Prometheus+Grafana監(jiān)控搭建,熟悉ELK/EFK日志收集分析,具備較強的故障定位能力(如通過日志、監(jiān)控指標快速定位網(wǎng)絡(luò)延遲、數(shù)據(jù)庫慢查詢等問題)。