职位描述
1、参与国际化短视频业务中的基础算法(LLM/MLLM、CV/NLP)相关工作,在智能对话、热点事件发现、内容生态治理、本地生活等业务运用算法能力进行深入理解;
2、参与研发LLM大语言模型及MLLM多模态大模型,并改进大模型在多个通用评测集及垂直业务评测集上的效果;
3、优化大模型的训练性能和利用率、推理加速&量化等工作。
职位要求
1、熟悉LLM/MLLM,有实际大模型调优、应用经验更佳;
2、熟悉prompt/sft/continuous pretrain/fine-tuning/蒸馏等优化思路,积极Follow最新AI相关技术和Paper;
3、计算机语言/视觉等相关领域有较好的理解和应用,包括但不限于:对话系统、视频理解、多模理解等;
4、对自监督、无监督、对比学习等训练方法和理论基础较为熟悉。