岗位职责:
1. 研发高质量的芯片基础软件栈,包括支撑大语言模型在内的深度学习,线性代数,科学计算,信号处理等方向的基础加速库;
2. 分析重要的性能指标,调优已有软件算法,并且对未来的软件进行优化和提升;
3. 和硬件/应用的同事协同工作,一起对大语言模型,CV模型,语音模型,推荐系统,科学计算和其他相关并行算法领域进行分析和优化;
4. 负责 AI模型推理/训练的端到端性能整体优化;
5. 实现AI/科学计算领域在GPGPU上的最新算法和最佳实践;
任职资格:
必须:
1. 熟悉 C++编程,了解常用数据结构及算法;
2. 熟悉线性代数,科学计算,机器学习,深度学习,AI算法等一个或多个领域;
3. 熟悉 GPU 或 AI加速芯片的体系结构,有过在不同架构芯片上的算法调优经验;
4. 熟悉并行算法优化的基本技巧,有对算法性能进行分析和优化的经验;
5. 熟悉计算机体系结构,操作系统;
加分项:
1. GPU的编程和优化经验(e.g. CUDA or OpenCL);
2. 有过机器学习方面的开发经验(尤其是深度学习),熟悉Tensorflow, Pytorch, TensorRT等框架/引擎的原理和使用方法;
3. 有过视觉/大语言模型的开发和调优经验,熟悉CNN/Transformer等网络的性能瓶颈和优化方向,能够把握相关领域的国际前沿发展趋势;
4. 有过数据科学,统计科学,图像处理,信号处理等方面的开发和优化经历;
5. 有软硬件协同优化、基于异构硬件的软件开发经验者优先;