专利详情

看准网网易有道专利详情
语法纠错的方法和用于语法纠错模型的训练方法及产品
申请号
2021100154758
申请日期
2021/01/05
公布号
CN112765968A
公布日
2021/05/07
专利类型
发明公布
分类号
G06F40/253(2020.01)I; G06F40/211(2020.01)I
申请人
网易有道信息技术(北京)有限公司
发明人
付凯 黄瑾 段亦涛
代理机构
北京维昊知识产权代理事务所(普通合伙)11804
申请人地址
北京市海淀区西北旺东路10号院中关村软件园西区7号楼A座1层
申请人邮编
100094
摘要
本发明的实施方式提供了一种文本处理方法。所述方法包括获取源文本和目标文本;根据源文本的第一段落数a和目标文本的第二段落数b,确定分割段落对,该分割段落对包括针对源文本的第一段落序号和针对目标文本的第二段落序号;根据分割段落对,分割源文本和目标文本,得到多个子源文本和与多个子源文本一一对应的多个子目标文本;以及采用预定对齐算法,对齐多个子源文本和多个子目标文本。本发明的方法、装置、介质以及计算设备通过先将两个文本划分为多个子文本,再对子文本进行对齐,可以降低后续段落对齐和句子对齐时因文本不规范导致的级联错误,从而提升文本对齐质量,并因此降低对两个文本的质量要求。