全球运行指挥中心(Global Operations Center, GOC)隶属阿里研发技术组织,扎根智能运维领域,通过机器学习对每秒数千万数据的处理,把握阿里每一项业务的运行状况,实现对近百个技术团队、数万名研发人员的应急信息实时互联,让一切线上问题无所遁形,让所有阿里技术团队令行禁止。加入这个团队,意味着你已经准备好挑战以下三个超级难题:
1、 如何打通近百个技术团队、数万名研发人员掌握的运维信息,让大家随时随地按需获取,做到无人值守的自动化运维
2、 如何让近百个技术团队在双十一、G20等重大保障中步调一致,预防风险,实时掌握内外部的各种信息,对紧急情况快速反应
3、 如何让遍布于全球的新零售、新金融、云计算等各种业务形态从诞生之时就得到完善的运维保障
在GOC,你能了解到阿里最新的业务形态,陪伴业务快速成长;你能了解到阿里全球化的业务,有机会亲临新加坡、美国、德国等国家,为阿里海外业务拓展保驾护航;你会找到一群志同道合的同学,他们已经基于数据和丰富的场景为解决难题点亮了灯塔,现在正需要你来给这些难题最后一击。GOC总部位于杭州,在北京、美国加州两地设有分支机构,现在全球范围内招募如下职位:
工作职责:
1. 学习并了解新零售、新金融、云计算、文化娱乐健康、全球化等各类业务
2. 学习并了解应用、系统、基础设施等各层技术的调用关系
3. 负责设计、落地各类业务的运维保障解决方案,包含但不局限于:线上问题管理、全维度全链路的监控管理、线上生产变更管理、故障容灾演练管理、大促重大活动管理以及稳定性文化建设
4. 深入支撑阿里业务系统的所有技术类问题,包括应急响应、应急调度、协同处理和整体业务的保障,并持续优化该体系的质量、效率、成本,提升整体服务品质;
5. 结合运维保障解决方案在业务侧的落地经验,基于GOC已有的运维保障体系进行补充完善,梳理提炼形成业务领域或特定行业场景的标准运维保障解决方案;
6、主导并推进标准运维保障解决方案落地到产品工具中,通过产品工具降低成本,提升服务效率,实现高效自动化且可扩展的技术服务运行模式;
7、基于对阿里内、行业内业务形态的了解,对阿里内业务团队、行业企业客户提供运维保障咨询服务,并能够基于产品工具,结合业务痛点输出运维保障解决方案;