1.设计和开发大规模分布式深度学习训练和推理平台;
2.跟踪/分析/评估各主流开源深度学习框架,参与自研深度学习软件栈的整体设计和实现,性能调优;
3.在海飞科自研AIGPU芯片上,设计与实现高性能的算子加速库。
岗位要求:
1.计算机/数学/物理/电子工程/自动控制专业,本科及以上学历;
2.熟练掌握计算机科学基础知识,对计算机系统(包括操作系统,计算机体系结构,并行处理等)有深刻的理解,且具有较丰富的相关实践经验;
3.精通C++/Python编程,熟悉图编译及网络优化;
4.熟练掌握Linux应用程序开发流程及环境;
5.理解深度学习理论,熟悉至少一种深度学习框架及相关软件,如TensorFlow/XLA,TVM,PyTorch,PaddlePaddle,NNVM,ONNX等,对框架内部有所了解;
6.良好的编程风格习惯,优秀的书面和口头沟通能力,团队协作精神。
加分项:
1.具有AI算子开发和优化经验;
2.CUDA/OpenMP/OpenCL相关开发经验;
3.任一种推理引擎TensorRT/TF-Lite/AndroidNN/CoreML/MNN上的开发使用经验;
4.熟悉常见深度学习模型算法,在计算机视觉、语音、自然语言处理中任一个领域的应用经验。
收起