岗位描述:
1、 负责垂域大模型的低成本、高效、快速、准确、可控地推理;
2、对大模型推理相关算法进行研究和优化,支撑公司在该领域的演进和提升;
3、跟踪、探索业界前沿的推理相关算法,推动有价值的技术方案研发落地;
4、输出LLM及AI算法方面的研究成果,负责相关专利的编写。
职位要求:
1、硕士以上学历,计算机、数学等相关专业,熟悉AI特别是大模型相关算法,具备优秀的理论基础;
2、具有丰富的大模型/机器学习等相关领域的研究和实践经验,有高性能计算或者推理加速相关经验优先,有操作系统和加速器架构相关知识经验优先;
3、熟练掌握Python\C\C++\等语言,具有扎实的代码功底和实战能力;
4、熟悉PyTorch/Tensorflow等开源深度学习框架,熟悉vLLM/TGI/TensorTRT等推理框架;
5、关注大模型领域的进展,具有高效复现论文成果的经验;
6、可以独立端到端地解决问题,开放心态,目标导向,愿意学习解决问题所需新的知识和技能。