工作职责:
1、负责云机房系统监控、问题处理、日常巡检、算力施工等工作;
2、负责云服务资产管理;
3、为客户提供公司产品技术支撑服务及部署施工;
4、对客户反馈的在线问题持续跟踪、协调解决、问题复盘等闭环处理,提炼用户的日常问题和需求,对平台存在的问题定期反馈和推动改善;
5、完善用户服务、机房部署、服务监控、应急响应等标准化工作流程;
6、负责日常运维工作,包括系统巡检、配置变更、系统更新等。
任职资格:
1、学习能力强,具备自驱型的工作态度和能力;
2、熟悉Linux系统管理,具有Linux系统维护1年以上经验;
3、熟悉Shell或Python脚本编程,能自己编写运维脚本;
4、熟悉zabbix,Prometheus等开源监控方案;salt、ansible等运维工具;
6、善于发现问题、推动问题的解决与完善,具备快速定位和排查故障的经验和能力。