岗位职责:
1.负责公司业务的运维工作,包含但不限于 故障处理、性能优化、容灾演练、容量规划、监控配置、运维规范流程等。
2.负责日常技术支持工作,通过问题汇总分析,沉淀知识库;通过运维机器人、运维自动化能力提升工作效率。
3.参与运维平台(发布、监控、集群管理等)的规划设计,提高运维&研发效率,提高资源利用率。
任职要求:
1.3年以上互联网公司运维经验,有高并发系统运维经验,具有一线互联网公司经验者优先。
2. 精通一门以上开发语言(go/python/java),能自主编写自动化运维脚本,具有运维平台开发经验的优先。
3. 熟悉Kubernetes生态,具有一定的Kubernetes实战经验,了解或开发过operator的优先。
4. 突出的全栈Debug能力,有良好的技术敏感度和风险识别能力,善于快速定位和处理平台故障,具备丰富的平台稳定性建设及性能优化经验。
5. 熟悉大型Web系统架构,以及相关应用的高可用和调优,包括:Web服务器、负载均衡、消息队列、数据库等。
6. 具备较强Ownership、逻辑思维能力、学习创新能力、文档整理能力,以及良好的沟通技巧和团队合作能力,性格开朗有较强抗压能力。
收起