大模型算法工程师

25-50K·15薪

北京

1-3年

本科

全职

职位描述

注：该岗位由资深前辈带教，无大模型经验的人才也可投递。

岗位优势
1. 面对真实客户的业务场景，有机会提升解决实际业务问题的能力，跟踪业内最新研究成果和技术动态，并积累丰富的行业落地经验。
2. 背靠公司内部的基模型团队，能不断地获得最新的基模型，以及先进的训练/调优经验，减少试错的成本。

工作职责
1. 针对政务、证券、科技等行业客户的场景设计基于大语言模型的技术方案，典型场景包括但不限于Document QA、结构化信息抽取、私有函数调用等；
2. 负责大语言模型技术方案的端到端研发，包括但不限于数据清洗、prompt tuning、指令跟随微调、领域知识注入、模型性能提升、模型效果评测等；
3. 跟踪并分析业内最新研究成果和技术动态，持续优化和改进现有模型和技术方案；
4. 根据业务需求，与外部团队开展技术交流与沟通。
任职要求
1. 优秀院校计算机相关专业本科及以上学历，有论文复现能力和算法工程交付经验；
2. 熟练使用Python语言，代码风格严谨高效；
3. 熟练掌握深度学习框架Pytorch；
4. 有团队意识，有良好的文档习惯和合作意识。
5. 3熟悉团队自研的AI应用开发工具https://github.com/LazyAGI/LazyLLM，（划重点，面试会问）

加分项：
1. 熟悉多种自然语言处理子任务，如问答系统，序列标注，情感分析，摘要生成及抽取，知识图谱等；
2. 了解NLP主流预训练语言模型（GPT/LLaMA/T5/PaLM/GLM/Bloom/BERT）；
熟悉算法框架huggingface-transformers；
3. 有大模型训练框架Deepspeed/ColossalAI使用经验。

公司介绍

作为人工智能软件公司，商汤科技以“坚持原创，让AI引领人类进步”为使命，旨在持续引领人工智能前沿研究，持续打造更具拓展性更普惠的人工智能软件平台，推动经济、社会和人类的发展，并持续吸引及培养顶尖人才，共同塑造未来。

商汤科技拥有深厚的学术积累，并长期投入于原创技术研究，不断增强行业领先的多模态、多任务通用人工智能能力，涵盖感知智能、自然语言处理、决策智能、智能内容生成等关键技术领域，同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。此外，商汤前瞻性打造新型人工智能基础设施——商汤AI大装置SenseCore，打通算力、算法和平台，并在此基础上建立“商汤日日新SenseNova”大模型及研发体系，以低成本解锁通用人工智能任务的能力，推动高效率、低成本、规模化的AI创新和落地，进而打通商业价值闭环，解决长尾应用问题，引领人工智能进入工业化发展阶段。商汤科技业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块，相关产品与解决方案深受客户与合作伙伴好评。

商汤倡导“发展”的人工智能伦理观，并积极参与有关数据安全、隐私保护、人工智能伦理道德和可持续人工智能的行业、国家及国际标准的制订，与多个国内及多边机构就人工智能的可持续及伦理发展开展了密切合作。商汤《AI可持续发展道德准则》被联合国人工智能战略资源指南选录，并于2021年6月发表，是亚洲唯一获此殊荣的人工智能公司。

商汤（股票代码：0020.HK）已于香港交易所主板挂牌上市。商汤在香港、上海、北京、深圳、成都、杭州、南平、青岛、西安、台北、澳门、京都、东京、新加坡、利雅得、阿布扎比、迪拜、吉隆坡、首尔等地设立办公室。另外，商汤科技在德国、泰国、印度尼西亚、菲律宾等国家均有业务。

北京海淀区理想国际大厦11层

校园宣讲会

西安交通大学宣讲会

就业中心一楼信息发布厅

西安电子科技大学宣讲会

北校区图书馆3层报告厅

电子科技大学宣讲会

清水河校区第二教学楼B317

武汉大学宣讲会

就业中心第二报告厅

华南理工大学宣讲会

大学城校区A4-404

查看全部校园宣讲会

面试经验

匿名用户

面试深圳市商汤科的测试工程师·深圳

感觉靠谱

面试：测试工程师。感觉总的来说都是满分，总的来说有难度，应该是通过了。

分布式存储测试：二面文件存储如何测试数据不一致的问题如何测试和解决文件存储的主要应用场景 k8s pod如何应用在分布式文件存储和对象存储文件存储和对象存储各有什么特点，三种存储方式的优缺点，性能比较版本交付时测试标准 sed awk grep用法算法：n!的阶乘的结果末尾有多少个连续的0 ...查看全文

贡献于贡献于2023-11-14

查看更多面经(88)

相似职位

大模型算法工程师

上海 | 拼多多

35-65K·18薪

大模型算法工程师(J11075...

北京 | 创新奇智

20-30K

大模型算法工程师

北京 | 栖息地

50-80K