注:该岗位由资深前辈带教,无大模型经验的人才也可投递。
岗位优势
1. 面对真实客户的业务场景,有机会提升解决实际业务问题的能力, 跟踪业内最新研究成果和技术动态,并积累丰富的行业落地经验。
2. 背靠公司内部的基模型团队,能不断地获得最新的基模型,以及先进的训练/调优经验,减少试错的成本。
工作职责
1. 针对政务、证券、科技等行业客户的场景设计基于大语言模型的技术方案,典型场景包括但不限于Document QA、结构化信息抽取、私有函数调用等;
2. 负责大语言模型技术方案的端到端研发,包括但不限于数据清洗、prompt tuning、指令跟随微调、领域知识注入、模型性能提升、模型效果评测等;
3. 跟踪并分析业内最新研究成果和技术动态,持续优化和改进现有模型和技术方案;
4. 根据业务需求,与外部团队开展技术交流与沟通。
任职要求
1. 优秀院校计算机相关专业本科及以上学历,有论文复现能力和算法工程交付经验;
2. 熟练使用Python语言,代码风格严谨高效;
3. 熟练掌握深度学习框架Pytorch;
4. 有团队意识,有良好的文档习惯和合作意识。
5. 3熟悉团队自研的AI应用开发工具https://github.com/LazyAGI/LazyLLM,(划重点,面试会问)
加分项:
1. 熟悉多种自然语言处理子任务,如问答系统,序列标注,情感分析,摘要生成及抽取,知识图谱等;
2. 了解NLP主流预训练语言模型(GPT/LLaMA/T5/PaLM/GLM/Bloom/BERT);
熟悉算法框架huggingface-transformers;
3. 有大模型训练框架Deepspeed/ColossalAI使用经验。