工作职责:
1. 负责TTS语音大模型(GPT-SoVITS、fishspeech、chattts)的技术研发及落地;
2. 探索语音模型前沿进展,结合网文业务探索TTS落地场景;
3. 较强的工程实践能力,构建语音合成底层推理架构,包括推理加速、合成效率等;
4. TTS及声音复刻场景下情感、音色、韵律等维度的技术研究;
5. 构建TTS音色库及相关语音合成平台;
任职资格:
1. 硕士及以上学历,计算机、语音等相关专业,有3年及以上的语音算法领域的专业学习或相关工作经验;
2. 有落地过实际TTS项目,参与并主导过TTS项目,掌握语音合成的理论基础和常用算法;
3. 熟练使用Pytorch或Tensorflow等主流深度学习算法框架,具备良好的编程习惯;
4. 有GPT-SoVITS、fishspeech、chattts相关经验者优先;
5. 有良好的团队协作能力和工程能力,能够拥抱变化并快速学习,并具备一定的抗压能力。
6. 在相关领域期刊/会议发表过文章优先,例如ICASSP、AAAI、IJCAI(会议)等。