1. 負責Linux系列操作系統(tǒng)(含Ubuntu、CentOS、RedHat等)服務器的部署、安裝、配置、初始化及日常運維管理,保障服務器集群穩(wěn)定、高效運行。
2. 承擔Ubuntu等系統(tǒng)環(huán)境下的應用服務(如Nginx、Apache、MySQL、Redis、Docker等)的部署、配置、優(yōu)化及故障排查,確保業(yè)務應用正常上線與持續(xù)運行。
3. 制定并執(zhí)行服務器及系統(tǒng)的監(jiān)控策略,利用Zabbix、Prometheus、Grafana等監(jiān)控工具,實時監(jiān)控系統(tǒng)資源(CPU、內存、磁盤、網絡)、服務狀態(tài)及業(yè)務指標,及時發(fā)現(xiàn)并預警異常問題。
4. 負責Linux/Ubuntu系統(tǒng)及業(yè)務的備份與恢復方案設計、實施,定期執(zhí)行數(shù)據(jù)備份操作,驗證備份有效性,確保在突發(fā)故障時能快速恢復數(shù)據(jù)與服務。
5. 開展系統(tǒng)安全防護工作,包括但不限于Ubuntu/Linux系統(tǒng)漏洞掃描與修復、防火墻規(guī)則配置、SSH安全加固、權限管理、病毒防護、入侵檢測等,保障服務器集群與業(yè)務數(shù)據(jù)的安全性。
6. 優(yōu)化Linux/Ubuntu系統(tǒng)性能,針對系統(tǒng)資源占用、網絡延遲、應用響應速度等問題進行分析與調優(yōu),提升服務器集群的整體運行效率;參與服務器硬件選型、資源擴容規(guī)劃與實施。
7. 負責運維自動化腳本(Shell、Python等)的編寫與優(yōu)化,實現(xiàn)服務器批量管理、配置自動化、故障自動告警與初步處理等,提升運維工作效率。
8. 處理日常運維故障,包括系統(tǒng)宕機、服務異常、網絡故障、數(shù)據(jù)異常等,快速定位問題根源并實施解決方案;記錄故障處理過程,形成運維知識庫。
9. 配合開發(fā)團隊完成應用上線、版本迭代、測試環(huán)境搭建等工作,提供Linux/Ubuntu系統(tǒng)層面的技術支持,協(xié)助解決開發(fā)過程中遇到的運維相關問題。
10. 關注Linux及Ubuntu系統(tǒng)相關技術動態(tài),學習前沿運維技術(如容器化、云原生、K8s等),并結合實際業(yè)務場景推動運維架構優(yōu)化與技術升級。
11. 編寫并完善運維文檔,包括系統(tǒng)配置手冊、運維操作手冊、故障處理手冊、應急預案等,規(guī)范運維工作流程。