1、负责字节跳动电商相关业务数据仓库的数据治理,对于数据质量,数据成本负责。
2、基于Hive/Flink等平台建设离线/实时数据仓库;
3、负责数据模型的设计,etl实施,etl性能优化以及相关技术问题的解决;
4、负责面向业务的olap,报表,数据提取工具等开发工作。
职位要求
1、熟悉大数据相关技术:Kafka/Flink/Hadoop/Druid/HBase/Hive 等;
2、熟练使用 Java、Go、Python语言中的一种或者多种;
3、具备数据仓库理论知识,掌握主流数据库管理和应用,精通SQL;
4、了解统计以及数据挖掘、机器学习、人工智能技术,会使用关联分析、分类预测、聚类分析等常用分析方法;
5、有高性能分布式平台开发经验,有电商行业经验优先。