百度

北京 ·互联网 ·10000人以上

计算机视觉算法工程师 - 多模态方向

25-40K·16薪

北京

1-3年

硕士

全职

职位描述
【岗位名称】计算机视觉算法工程师 - 多模态方向
【工作职责】
1. 负责AIGC的多模态内容生成、内容理解、跨模态匹配效果等研发和优化并支持工程落地;
2. 负责视频/图像/布局等生成过程中,相关模型的预训练、微调、加速推理和部署等工作和技术研发;
3. 负责文生图模型的实现和调优,支持细粒度的图文理解、画质精美结构稳定的图像生成。
4. 负责解决视频生成的前沿难点,包括但不限于视频生成的帧间连续性问题、语义对齐问题、风格化定制化问题等。
5. 负责跟进追踪多模态、LLM等前沿技术方向,并进行模型的迭代优化。
【职位要求】
1. 硕士及以上学历,在计算机视觉某个或几个领域有深入的研究,如:图文理解、文生图、视频生成、多模态检索等;
2. 熟悉一种或多种多模态、生成式模型(CV/NLP)的相关技术包括但不限于:预训练、微调(LoRA、ControlNet等)、RLHF等,了解主流模型(Diffusion/GPT/CLIP/BLIP等)的原理并有自己的理解;
3. 具备扎实的计算机背景知识、机器学习、深度学习实践经验,熟悉一种主流的机器学习框架(Tensorflow,PyTorch,MXNet,PaddlePaddle)
4. 具备良好的解决问题能力、团队合作能力和沟通能力,并且善于主动发现问题并且积极探索。
5. 在顶会上有论文者优先、包括但不限于CVPR、NeurIPS、ICCV、AAAI、ECCV等。
公司介绍
“百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。
百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
北京海淀区百度科技园K1
校园宣讲会

中山大学 宣讲会

东校区行政楼B102

武汉大学 宣讲会

人文馆主厅

华中科技大学 宣讲会

一号楼报告厅

北京大学 宣讲会

英杰交流中心阳光大厅

大连理工大学 宣讲会

-科技园报告厅

查看全部校园宣讲会
面试经验

匿名用户

面试百度的机器学习·北京

感觉没戏
面试:机器学习。面试印象不是很深刻,难度递增,应该是没过。
感觉不是很好,需要代码测试
查看更多面经(31327)
相似职位