1、熟练掌握ETL工具,如Informatica PowerCenter,Talend,SSIS,DataStage等。
2、熟悉ETL流程,包括数据抽取、转换、加载,数据清洗,数据验证和错误处理等。
3、熟练掌握SQL语言,能够编写高效的SQL查询,并进行性能优化。
4、熟练掌握数据仓库和数据模型设计,包括维度模型和事实模型等。
5、熟练掌握Hadoop生态系统和相关技术,如HDFS,YARN,MapReduce,Hive,Spark等。
6、具有大规模数据处理和分布式计算经验,能够处理海量数据的存储和计算。
7、具有团队合作精神和项目管理经验,能够与其他部门进行有效的沟通和协作。
8、5年数据治理项目经验,具备政府、企业、金融行业等大数据项目背景。
加分项:有航空业经验
PS:需出差广州