大模型算法工程师

30-50K·13薪

上海

3-5年

硕士

全职

职位描述

职责描述：
1. 训练系统部分：参与训练数据收集/清洗、Post Pretrain、SFT、RF、Prompt Enginering等具体工作；
2. 应用落地部分：负责大模型的模型适配与应用落地，包括但不限于LLM、Langchain、Agent、Eval等技术；
3. 深入调研和关注大模型/多模态等方向的前沿技术。
任职要求：
1. 参与过大模型相关开发工作，包括但不限于数据清洗、训练框架开发、评测、推理部署等；
2. 熟悉常见的分布式训练框架，如DeepSpeed、Megatron-LM等；
3. 熟悉常见的大模型结构及其训练细节，如LLamA、ChatGLM、BaiChuan、GPT等；
4. 对大模型落地充满热情，对AGI有浓厚兴趣；
5. 有自然语言处理和多模态的研发背景，对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。

公司介绍

瀚博半导体是一家高端GPU芯片提供商，成立于2018年12月，注册地在中国上海。瀚博半导体为人工智能核心算力和图形渲染、内容生成、AIGC提供全栈式芯片解决方案。瀚博秉持“为数字和像素世界提供浩瀚算力”的使命和愿景，潜心研发核心技术，目前拥有自主研发的核心IP以及两代GPU芯片，提供适用于通用AI计算和图形渲染的GPU产品。

瀚博凭借前沿的自主原创架构、强大的软硬件融合开发能力以及丰富的设计经验研发出高质量的GPU产品，瀚博两代芯片现已量产并商业化落地，赋能人工智能与渲染产业，助力大模型与生成式人工智能、智算中心、智慧工业、智慧交通、数字孪生、工业软件、云渲染等应用落地。

公司目前拥有500人以上的团队，研发人员占90%以上，超过80%员工具有硕士及以上学历。核心员工来自世界知名的高科技公司，核心团队拥有18年以上芯片与软件设计研发、管理和市场经验，包括业界第一颗7nm GPU在内的100+款芯片流片、量产经验。公司现处于快速成长期，发展前景广阔，员工有很大的职业成长空间和福利待遇。

上海浦东新区集创公园1号楼

面试经验