岗位职责:
1、负责预训练大模型的工程化落地,结合业务场景,制定大模型应用架构设计方案;
2、理解和分析业务问题,打通大模型与业务关节,解决大模型在不同垂直领域落地问题;
3、负责大模型的部署、调优,确保大模型在各种软硬件架构上的功能、性能、稳定性;
4、深入研究大模型的微调&推理加速,具备对标业界领先水准的加速能力;
5、负责数据处理、清洗和整合,分析大模型训练结果;
任职资格:
1、本科及以上学历,计算机相关专业背景;
2、具备大模型AI-Agent研发经验,及大模型预训练&微调&推理加速经验;
3、熟悉各种模型开发框架和工具,包括但不限于TensorFlow、PyTorch等;
4、熟悉自然语言处理、语义理解、知识图谱、CV预训练模型等多个领域,能够灵活运用大模型,多模态解决实际问题;
5、对开源大模型项目(如BERT、GPT、T5等)有深入研究和实践经验,熟悉其优缺点和适用场景,能够根据需求进行定制化开发;
过往经验:
1、在国内头部科技企业或科研单位有人工智能相关工作经历者优先;
2、在人工智能相关领域,有以下经历者优先:在国内外核心期刊发表过学术论文者(第一作者);承担过区市级以上课题、科研项目,取得授权专利(第一作者);制定过行业标准或国家标准(前三作者);
3、在大模型AI-Agent研发及大模型预训练&微调&推理加速方面,有成熟产品经验者优先;
4、在人工智能相关领域,有带领研发团队(5人及以上)经验者优先;
收起