基于自动抽取词汇信息的双语句子对齐

来源 :计算机学报 | 被引量 : 0次 | 上传用户:xiazaikankan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点:前者实现简单、效率高,但精度低;后者精度高但实现复杂.本文提出一种新的对齐方法,首先利用基于长度的方法对文本进行粗对齐,然后在双语平行文本中确定锚点并自动抽取双语对应的关键词汇,降低了对齐问题的复杂度并减少了错误的蔓延.最后再利用所得到的词汇对应信息进行句子的对齐.这种方法融合了基于长度和基于词汇方法的优点,实验表明,它很大程度地提高了对齐的精度.
其他文献
数学在畜牧业生产当中有着广泛的应用。本文列举了畜牧业生产实际中的部分实例,并运用数学知识予以解决,旨在促进数学与畜牧科学的交叉渗透和共同发展,使数学及畜牧工作者更
多不饱和脂肪酸(polyunsaturated fatty acids,PUFA)是指含有两个或两个以上双键且碳链长为18-22个碳原子的直链脂肪酸。营养学上对PUFA的命名多采用ω编号系统(或n编号系统),从脂
多根、多处肋骨骨折后所造成的反常呼吸运动,使呼吸效能显著降低,而导致严重的缺氧和呼吸功能紊乱,通常由直接暴力所致,最突出的临床表现为呼吸功能障碍。
HACCP是迄今为止食品安全生产方面最有效、最科学的质量管理方法之一。本文根据HACCP的技术规程,对肉牛生产的各流程进行分析,确定了肉牛生产过程中的关键控制点,并提出了控