首先是公司技术人员电话面试,问了以下问题:
1、hashtable和hasMap的区别
2、堆排序的时间复杂度,为什么时间复杂度上这样?
3、hadoop中 如何保证map和reduce数据的正确性,shuffle操作的功能?
4、如何实现Kmeans算法的分布式?
5、描述AdaBoost算法的思路,即核心部分伪代码
其次是现场面试:
1、项目经历,以及详细的流程,在此过程中问了特征选择、数据预处理、算法选择、模型评估、模型部署等细节问题
2、你认为最出彩的项目,遇到过什么问题?是如何解决
3、随机森林算法的伪代码或者C++实现
4、 GBDT算法的思路,优劣及如何调优...查看更多