1、学校专业、个人基本信息:我就解释,我是中山医学院负责建模方向的研一学生,做的事情跟计算机系的学生一样。本科是学医的。面试官好像听出来了我在极力说明我真的是认真的,让我不要紧张。
2、根据简历问一些做过的项目和比赛:腾讯算法大赛:
1)这个比赛的任务是:预测用户广告点击率。
2)数据量:几千万条,一共16个g的数据。
3)特征工程:单值离散型变量用了onehot,多值离散型变量用了countvector,单值连续型变量未作处理。自己又做了一些组合特征和计数特征。Onehot后会维度爆炸,因为每一列的离散型变量有很多,onehot后有几个离散型变量就扩增了多少列,特征维度就爆炸了。进行了labelcoder。
4)模型:初赛使用lgb和xgb,复赛使用了ffm和nn。
5)Lgb和xgb的区别:没答上来,我说的是lgb的分裂节点多。大佬说lgb最强的地方是通过直方图找分裂点,lgb靠叶子,xgb靠深度。
6)Ffm是什么:因子分解机,具体原理不知道。
...查看更多