职位描述
1. 负责数据平台的研发;
2. 负责Hadoop、Spark、Hive、Kafka、Flume、Flink等组件的性能优化、功能扩展、框架研发;
3. 负责开发和优化数据采集、传输、存储、计算、查询等子系统;
4. 负责数据产品的需求沟通、系统设计开发。
任职资格
- 5~8年开发可扩展的大数据平台上的数据湖/数据仓库的经验。
- 必须具备Python编程的良好经验。
- 深入了解数据建模、数据集成和ETL过程。
- 对数据治理、数据质量和数据安全有深入的了解。
- 有云端数据平台(如AWS、Azure、GCP)和大数据技术(如Hadoop、Spark、Kafka)的经验。
- 熟悉机器学习的概念和工具。
- 出色的解决问题和分析能力。
- 良好的沟通和协作能力。
- 能够在快节奏和动态的环境中工作。
收起