职位描述:
1、OCR图像识别:开发和优化OCR图像识别API,确保高准确率和高效率的文本提取和识别;
2、视频分析与处理:利用WebRTC开源框架,开发和维护视频流的捕获、处理和分析系统;
3、音频处理:实现高效的语音处理功能,包括但不限于TTS(文本转语音)和STT(语音转文本)技术;
4、自然语言处理(NLP):开发和维护NLP相关的应用,包括文本分析、语义理解等;
5、预训练大语言模型微调:根据项目需求对大型预训练语言模型进行微调,以适应特定任务;
6、技术研究与创新:不断追踪AI领域最新技术动态,提出创新解决方案,提升产品竞争力。
任职要求:
1、计算机科学、软件工程或相关领域的本科及以上学历;
2、至少3年相关领域的工作经验;
3、精通Python、C++或Java等编程语言;
4、精通OCR图像识别技术,有PaddleOCR、EasyOCR、OpenCV等开源库实际使用经验优先;
5、熟悉WebRTC或其他视频处理技术优先;
6、有TensorFlow、PyTorch等机器学习框架使用经验优先;
7、出色的分析和解决问题能力,良好的团队合作精神和沟通能力。
收起