关于职位
1. 基础设施稳定性保障:确保机房、服务器、存储、CI/CD、监控告警平台等基础设施的高可用性,持续提升系统 SLA;
2. 运维平台开发与优化:参与运维自动化平台和工具的设计、开发与迭代,推动自动化运维体系升级;
3. 数据驱动运维改进:基于监控告警、问题管理、历史事故、资源利用率等指标,分析系统⻛险,持续优化架构与运维流程;
4. 技术沉淀与知识共享:总结运维与开发实践,撰写技术文档,推动团队知识积累和经验复用。
技能和经验要求
1. 本科及以上学历,计算机及相关专业;
2. 扎实的计算机基础,熟悉 Linux 操作系统原理;
3. 了解网络与存储基础知识,具备基本的排障能力;
...