数据开发面试一般,共2轮面试
Q:自我介绍公司经历,都干了些什么1条回答
Q:上一家公司干了些什么
你们公司的业务流程讲了讲购买、配网、埋点、计算等流程数仓面向的用户群体,
Q:有没有KPI考核1条回答
Q:说说你对数仓的理解
Q:数仓为什么要分层
Q: MapReduce的过程
Q:Spark相比MapReduce有什么不同1条回答
Q:说说你对Flink的理解数仓建模中,最难的点在哪
开放性话题 可能的方向:保证数据准确性
最基础也是最难的要求为什么问这个问题?在面试官知识体系中,肯定有好几层级建设难点,这取决于自己对数仓的认识到了哪一层级如果说没有什么,那就表明自己对数仓建模的思考不够深入,遇到的问题不够多,经验不足够丰富
Q:MapReduce过程中出现数据倾斜怎么办
一道SQL倾斜面试问题,要求写出能够解决倾斜问题的SQL