一、職位描述
1. 負(fù)責(zé)數(shù)據(jù)中臺(tái)產(chǎn)品(K8s容器化架構(gòu))的全流程實(shí)施與運(yùn)維,包括環(huán)境搭建、資源分配、集群部署與日常維護(hù);
2. 保障中臺(tái)各類應(yīng)用服務(wù)SLA,覆蓋性能調(diào)優(yōu)、日志異常分析、服務(wù)彈性擴(kuò)縮容、版本迭代、配置與權(quán)限全生命周期管理及變更管控;
3. 承擔(dān)Hadoop、HBase、Kafka、Flink、Doris等大數(shù)據(jù)核心引擎集群的運(yùn)維工作,涵蓋7×24小時(shí)監(jiān)控、周期性巡檢、故障應(yīng)急響應(yīng)、服務(wù)啟停、集群擴(kuò)容縮容及資源精細(xì)化管控;
4. 攻堅(jiān)平臺(tái)技術(shù)瓶頸,快速響應(yīng)并解決突發(fā)故障(如數(shù)據(jù)鏈路中斷、集群性能雪崩、容器資源搶占等),建立并優(yōu)化故障應(yīng)急預(yù)案;
5. 協(xié)同研發(fā)團(tuán)隊(duì)推進(jìn)運(yùn)維體系標(biāo)準(zhǔn)化,落地自動(dòng)化運(yùn)維工具與流程,提升運(yùn)維效率與平臺(tái)穩(wěn)定性。
二、任職要求
1.35歲以下,本科及以上學(xué)歷,計(jì)算機(jī)/軟件工程等相關(guān)專業(yè),5年及以上大數(shù)據(jù)平臺(tái)運(yùn)維實(shí)戰(zhàn)經(jīng)驗(yàn),有中臺(tái)運(yùn)維經(jīng)驗(yàn)優(yōu)先;
2. 精通Ansible等自動(dòng)化運(yùn)維工具,具備K8s集群搭建、資源調(diào)度、容器編排的實(shí)戰(zhàn)能力,能獨(dú)立完成K8s環(huán)境下大數(shù)據(jù)組件的部署與運(yùn)維;
3. 深度掌握大數(shù)據(jù)生態(tài)圈核心組件(Kafka、Hive、Hadoop、Spark、Flink、Doris)的原理與運(yùn)維,熟悉組件間協(xié)同架構(gòu)及故障排查邏輯;
4. 熟練使用Flink CDC、Sqoop、DataX等數(shù)據(jù)同步工具及主流任務(wù)調(diào)度平臺(tái),能保障數(shù)據(jù)流轉(zhuǎn)鏈路的穩(wěn)定性;
5. 具備優(yōu)秀的跨團(tuán)隊(duì)溝通能力,抗壓性強(qiáng),有強(qiáng)烈的責(zé)任心與團(tuán)隊(duì)協(xié)作意識(shí),可獨(dú)立應(yīng)對(duì)復(fù)雜技術(shù)故障并推動(dòng)問題閉環(huán)。