职位详情

强化学习对抗博弈训练专家
20-35K·15薪
北京 海淀区
1-3年
本科
职位详情
强化学习
机器学习
规控算法
推荐算法
搜索算法
并行计算
分布式训练
大数据处理工具(Spark/Hadoop/Hive)
算法工程化经验
多智能体
职位描述: 1.负责智能决策场景下的AI算法在工业界落地,充分理解场景与业务问题,设计和优化算法模型和训练效果,完成项目交付; 2.负责分布式深度强化学习算法框架的功能完善与优化; 3.负责深度强化学习相关的前沿技术创新研究与探索。 职位要求: 1.计算机、人工智能相关专业的硕士、博士以及优秀的本科生,对机器学习、深度学习、强化学习有较深入理解; 2.编程基础扎实,具有良好的代码风格和软件工程思维,具有良好的分析和解决问题的能力; 3.具有强化学习研究/实习经验,对拟人化学习、多难度学习、多智能体学习、模仿学习等有积累者优先; 4.具有神经网络自动调参相关经验者优先;具有分布式算法经验者优先,具有算法平台经验者优先 3、具有较好的沟通能力,能够快速跟客户沟通,理解和翻译客户需求; 4、具有较强的组织协调能力和良好的公众表达能力,具有大局观和较好的执行力。
收起
北京未尔锐创科技有限公司
北京市 · 计算机软件 · 20-99人
A级纳税人
高新技术企业
科技型中小企业
专精特新企业
瞪羚企业