o 职位描述
- 大语言模型训练、精调,使大模型效果在垂直领域的智能客服、知识库、办公助手等场景行业领先
- 解决大模型生成内容的可控可信度不足、推理效率低的问题
- 协同工程化和业务团队,实现大模型在业务场景的落地
职位要求
- 计算机相关专业本科以上学历,且有良好的代码开发能力
- 对Transformer架构有深入理解,熟悉NLP主流大模型如GPT3/LLaMA/GLM
- 熟悉主流的大模型精调方法,如Prefix Tuning、Prompt Tuning、LoRA、RLHF等
- 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案
- 熟悉常见的模型加速和小型化技术,如量化/剪枝/蒸馏等
- 有百亿/千亿参数大语言模型训练调优经验的优先
- 发表过大模型、机器学习、深度学习等相关研究AI顶会论文优先
- 有开源项目开发经验优先