职位描述
智能交互技术部负责蚂蚁集团对话、数字人、语音等相关AI技术的研发工作,支持蚂蚁智能客服、理财/保险支小宝、外呼平台等场景,是蚂蚁对话大模型核心研发团队。
1. NLP大模型前沿探索,推动NLP大模型效果达到行业领先
2. 解决大模型生成内容的可控可信度不足、推理效率低的问题,解决大模型业务落地的技术障碍
3. 协同跨团队技术和业务同学共同达成技术和业务目标
职位要求
1. 计算机相关专业获得硕士学位, 博士优先, 发表过大模型相关研究AI顶会论文优先;
2. 对NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等的原理和差异有深入的理解;
3. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先;
4. 熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT;
5. 有良好的代码开发能力,有开源项目开发经验优先。