岗位职责:
1.负责多模态大语言模型等相关技术研究,包括跨模态对齐、多模态理解,多模态生成等任务,研发业界领先的多模态大模型;
2.持续跟进业界最新的多模态大模型算法,参与多模态大模型的设计、训练、调优及评测工作,并推进多模态大模型在业务场景的应用落地;
职位要求:
1.计算机科学、机器学习、人工智能、应用数学等相关专业,硕士及以上学历;
2.在计算机视觉、多模态理解等方面有扎实的研究基础,熟悉主流模型和算法,如CLIP、ALBEF、 BEIT3、InstructBLIP、LLAVA等多模态理解&生成算法;
3.熟悉深度学习框架,如TensorFlow或Pytorch;了解分布式训练框架,如Deepspeed和Meatron-LM等,并有一定的多机多卡分布式训练经验;
4.较强的工程实现能力,熟练掌握C/C++, JAVA,Python等至少一种语言;
5.有高质量论文发表者优先(如CVPR,AAAI,NIPS,TIP,ICCV,ECCV等);
6.具备极强的学习能力和技术追求,良好的团队合作和沟通能力;