岗位职责:
1、保障公司业务平台的高并发性、高可用性、高稳定性、高安全性;做好容灾措施,确保无重大事故;
2、负责自动化运维平台及其组件的设计、开发、迭代、维护,完善发布部署、扩容、性能分析优化等运维工作;
3、负责优化、改进运维支持系统,建设应用监控、报警系统,并保证其安全高效稳定运行;
4、研究运维相关前沿技术,根据系统需求制定并改进运维技术方案;
5、配合数据分析、开发人员进行相关数据统计、参数配置、系统测试及系统监控;
6、按照运维工作标准化、规范化的要求,编制整理应用系统相关技术资料,文档齐全并更新及时。
岗位要求:
1、计算机相关专业,本科及以上毕业,5年以上运维工作经验;
2、有丰富的Linux系统管理经验,熟悉高可用集群、负载均衡集群的规划与搭建,熟悉Linux性能调优;精通shell,python等脚本编程(至少一种);
3、熟练使用容器技术,对Docker有深入理解,且在生产环境使用Kubernetes经验(必须)
4、熟练使用阿里云, 腾讯云, AWS 等国内外主流云平台的经验,vmware vsphere虚拟化平台的维护等;
5、熟悉常用的运维监控手段以及组件,如Prometheus,InflexDB,Falcon等
6、熟悉研发常用代码版本管理软件Github/GitLab/SVN,通信协议 TCP/HTTP 及 RESTful 标准
7、对持续集成和持续交付(CI/CD)有深入理解,熟练 DevOps 工具,如:Jenkins, Ansible 等的经验;
8、深刻理解mysql,mongodb,redis,kafka,Elasticsearch等工作原理,熟练掌握数据库及缓存系统的管理与维护,熟悉其集群,分片,读写分离等的实现原理及故障处理;
9、拥有优秀的技术钻研能力和自学能力,能根据现有的知识和学习方法,不断学习自己所未知的、在实际系统运维过程中所需要的新知识。
10、熟悉springcloud,对微服务架构和consul有运维经验为佳;