职位描述
1、与业务方紧密合作,理清业务需求并从多模态角度提供解决方案;
2、跟进前沿多模态算法,了解常见多模态任务、数据、评测手段,能够使用内外部多模态工具;
3、处理和分析多模态数据,需要能够有效地清洗、整理和可视化数据等;
4、在多模态LLM上要做到用能改,并在业务数据上finetune;
5、着重探索基于多模态LLM的视频内容理解,支撑各类业务;
6、与各团队紧密协作,确保算法实施满足业务需求。
职位要求
1、优秀的编程和算法能力,熟悉python/C++编程语言,熟悉MapReduce,了解Hadoop、Spark系统,掌握深度学习基础知识,熟悉Pytorch、Tensorflow等至少一种深度学习框架;
2、熟悉NLP、CV等相关技术,熟悉Transformer等深度学习算法,在NLP和CV方面有一定积累沉淀,有一定的多模态相关背景,较强的算法实现能力,熟悉多模态常用算法;
3、具备深度预训练模型经验者优先。有多模态、NLP、CV、视频/音频算法相关领域经验者优先;对LLM、多模态学习有深入理解和实践,有预训练、可控内容生成方向经验者优先;
4、有生成模型GAN、VAE、diffusion等工程项目为加分项;有AIGC相关经验者为加分项;有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)为加分项;
5、具备良好的逻辑思维能力、沟通协作能力、自我学习能力,保持对事物的好奇心。态度积极向上,有责任心。