面试的是大模型垂类应用方向,强化学习主要是聊项目经历以及强化学习相关知识。以及强化学习拟人化,怎么拟人化?代码题:将二叉树的节点值修改为子节点值的(node.val = node.left.val+node.right)。主要是聊项目经历。以及是否知道一些机器学习的内容。给了一道机器学习相关的业务题,说怎么完成这个任务。面试管介绍了团队构成和业务方向。代码题:最长连续数字字串,例如's23dm44555',返回44555交叉面。1.介绍强化学习基础知识,例如PPO算法,value based和policy based算法。DDPG算法。如何解决Q-learning的过拟合?信用分配和回报分解?2.机器学习基础知识,有哪些机器学习算法,什么是生成式算法,什么是判别式算法。聊项目,以及在各个项目中的角色。项目的难点,成就以及解决思路。阐述RLHF,以及对大模型,AGI等未来发展的看发。面试官介绍了团队组成等等。HRBP面过往经历。。。其实HRBP面感觉不是很好过的。可能是横向对比挂了。...查看更多