职责描述:
1. 训练系统部分:参与训练数据收集/清洗、Post Pretrain、SFT、RF、Prompt Enginering等具体工作;
2. 应用落地部分:负责大模型的模型适配与应用落地,包括但不限于LLM、Langchain、Agent、Eval等技术;
3. 深入调研和关注大模型/多模态等方向的前沿技术。
任职要求:
1. 参与过大模型相关开发工作,包括但不限于数据清洗、训练框架开发、评测、推理部署等;
2. 熟悉常见的分布式训练框架,如DeepSpeed、Megatron-LM等;
3. 熟悉常见的大模型结构及其训练细节,如LLamA、ChatGLM、BaiChuan、GPT等;
4. 对大模型落地充满热情,对AGI有浓厚兴趣;
5. 有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。