自我介绍?说一说你最熟悉的一个项目?你们项目中数仓模型是怎么建立的?里面有哪些表?你说你们用的是星型模型,那你们流量日志分析是怎么建立他的域的?(这个问题回答不了,他就笑了,然后不再问项目,问hive知识了)你在hive中用到过哪些函数?Hive的数据倾斜有哪些解决方案?
Sortby和orderby的区别,哪一个会产生数据倾斜,为什么会产生数据倾斜?说一个具体你在工作中的解决数据倾斜的案例?(然后三道情景题)有一道,当时用的窗口函数解决的,他说不用窗口函数的方案是啥?有一道是求最近7天的连续三天活跃用户?
...查看更多