我面的是实习生,第一次的部门是数据应用部
1面问简历,问了我参加的一些比赛,讲讲拿冠军的比赛具体思路
然后让我介绍常用算法,还问了预处理,特征工程,模型融合,GBDT和xgboost区别
后面问融合一定有提升吗?我回答的是不一定,取决的是融合结果的相关性和差异性。。其实我心里想的是融合基本都是有提升的,至少目前的实践是这样。。。
2面让我想一个算法,怎么在2G内存里,找100T数据的中位数,这个确实想了很久说了很多方法都不太好,我心里明白肯定是分治,尼玛脑子短路瞎说了一通,后面又问怎么解决mapreduce里面的数据倾斜,我说再hash一遍,或者rank一次
然后就被鄙视了,刷掉之后简历放到菜鸟网络去了,于是又苦逼的开始一面
1面还是问的简历上的东西,跟之前的差不多,不过没有上次一面问的那么多
2面问的我的研究方向,解释下粗糙集什么的,还问我做过哪些研究,我说有主动学习,不平衡数据,半监督这些。2面的估计是个总监之类的师兄吧,天池比赛菜鸟网络就是他出的题。
不知道还有三面没……...查看更多