大模型开发岗
岗位职责:
1、负责将大模型从理论研究转化为2B/2C的落地应用,包括系统设计,训练、微调、推理以及各环节优化
2、与产品团队紧密合作,理解业务需求,设计并实现大模型解决方案
3、负责解决大模型在生成质量、生成性能、安全性方面的算法优化问题
4、跟踪最新的行业动态和技术发展,通过研究论文、技术会议、行业先进案例等途径不断提升大模型专业知识和产品解决方案的能力
任职资格:
1、计算机科学、数学、人工智能、统计学或相关领域的硕士或博士学位,硕士3年以上NLP深度学习算法方向工作经历
2、具有在大规模数据集上训练大模型的实践经验
3、熟练掌握主流深度学习框架pytorch/tensorflow,以及大模型常用训练框架、推理架构如Megatron-LM/ DeepSpeed训练框架等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先
4、深入了解大模型在产品化过程中的调优、量化、封装、部署、调度、并发、时延等常见软硬件问题,熟悉大模型常用训练框架、推理架构
5、具备良好的产品意识和出色的问题解决能力,能够独立进行问题分析和解决方案设计
6、良好的沟通能力和团队合作精神