第一轮电话面,简单问了一下项目,然后开始技术面,具体问题:
1.svm用过没有,优缺点有哪些,线性kernel设置过软间隔参数吗,影响是什么;
2.拿到数据后清洗的流程,具体的Python方法;
3.spark用过没有,会不会用scala,mapreduce的基本流程;
4.RF与GBDT的基本原理,讲一下GBDT收敛快的原因;
5.决策树分为哪几种,cart分类依据和公式,ID3剪枝用过没有,剪枝如何分类,具体方法又是什么;
6.评估模型标准,列举两种即可;
7.如何避免过拟合?正则化了解吗,L0,L1,L2的区别?L1易生成稀疏矩阵的原理;
8.看你搞过路径规划,动态规划和迪杰斯特拉算法了解吗,简单说说原理;
9.快速排序和堆排序的时间复杂度,最好情况最坏情况,简单说说原因;
10.为什么想离职,电科云了解吗,有什么想问的。
总共过程约46分钟,spark答了不会,图动态规划讲的比较含糊,堆排序说的啰嗦了,其他大体算是答完,第二轮等通知说岗位更需要JAVA开发,问我愿不愿意转,问了具体需求,springboot+高并发处理,想了想基础一般,二轮没过,就这样。
...查看更多