岗位职责:
1.参与商业产品部矩阵产品搜索/增长能力建设,包括但不限于QU意图理解、相关性排序、混排、个性化触达等;
2.参与矩阵产品大规模预训练语言模型应用落地、训练领域大模型,包括但不限于知识问答、工具增强、多轮对话优化、多模态、大模型Reasoning等;
3.参与领域知识/图谱构建,包括抽取、补全等。
岗位要求:
1.硕士及以上学历,计算机相关专业;
2.熟练掌握Python/C++语言,熟练应用一种以上深度学习框架,包括但不限于Pytorch/Tensorflow;
3.熟悉Huggingface相关框架,熟悉deepspeed;
4.深入理解大模型相关知识,包括但不限于Transformer、GPT,熟悉至少一种主流大模型架构,如LLaMA/GLM;
5.具有良好的问题分析和问题解决能力,对相关技术领域具有敏锐的洞察力和较强的学习能力,能积极应对有挑战性的工作;
6.踏实认真,乐观积极,具有良好的团队合作精神,乐于分享,与团队共同成长。