专利详情

看准网OKVoice专利详情
基于自回归网络的非平行语料语音转换方法及系统
申请号
202011161519X
申请日期
2020/10/27
公布号
CN112331183A
公布日
2021/02/05
专利类型
发明公布
分类号
G10L15/02(2006.01)I; G10L13/02(2013.01)I
申请人
中科极限元(杭州)智能科技股份有限公司
发明人
连政 温正棋
代理机构
杭州浙科专利事务所(普通合伙)33213
申请人地址
浙江省杭州市江干区九环路9号4号楼11楼1105室
申请人邮编
310016
摘要
本发明公开了基于前馈神经网络的低延时语音识别模型及训练方法,模型包括:编码器、解码器和总结器;训练方法包括:S11,语音特征提取;S12,编码器将声学特征序列转换为高层语义表示;S13,总结器通过预设的位置编码和高层语义表示转换为对应于每一个词位置的高层语义表示;S14,解码器从对应于每一个词位置的表示中进一步提取词级别的语义信息;识别方法还包括预测阶段,根据解码器的输出在每一个位置选取概率最大的词。