中英可比语料库中翻译等价对抽取方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zbt_25
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
回顾了语料库分类及可比语料库中翻译等价对抽取方法研究的历史。根据从可比语料库中提取翻译等价对所依据的基本假设:一个语言中一个词在对应到另外一种语言时其与周围词之间的共现搭配关系仍然被保持,采用双向等价对获取计算然后求交集、词加权因数TF(iw)*IDF(i)值计算、上下文词的词性信息利用的方法来提高翻译等价对提取正确率。描述了翻译等价对抽取实验步骤,并对实验结果进行了简要分析。实验结果表明上述方法可以有效提高翻译等价对计算结果的正确率。最后提出了需要进一研究的问题。
其他文献
摘 要 玉米作为我国主要的粮食,其产量的高低直接关系到我国人均生活水平的高低。因此,加强玉米种植业的高产能力是十分有必要的。下面针对所给出的论题对常见的玉米病虫害及其防治技术进行一个简单的分析与探讨。  关键词 玉米;病虫害防治技术  中图分类号:S513 文献标志码:B 文章编号:1673-890X(2016)12-0-02  我国是农业大国,在农业生产方面,以玉米、小麦和水稻为主要的粮食,而玉
给出了一种基于人工免疫的可更新簇聚类算法.该算法在aiNet聚类算法的基础上,引入记忆抗体"年龄"的概念.模型学习过程中在抗体不断地与抗原接触时,超过"年龄"阈值的记忆抗体转化
为了克服无线多媒体传感器网络(WMSNs)中单个节点存储、处理能力和能量严重受限的问题,在研究双正交叠式变换(LBT)的基础上,提出了一种适用于无线多媒体传感器网络的基于LBT变换的
多通道随机通信系统的研究是一个新的课题,在以往的研究中,大多集中在固定分配多址接入方式。引入了随机多址接入技术,以便在突发性事件中保持良好的性能,并采用蒙特卡罗方法
用基于非线性子空间的核独立成分分析方法(KICA)对人脸图像进行特征提取,用三层的BP网络作为分类器,对人脸进行识别。在简单介绍基本的独立成分分析(ICA)的基本原理的基础上,对KICA的原理和算法作了详细的描述,并详细介绍了三层BP网络的设计。最后为了验证KICA+BP网络的效果,进行对比实验和分析。实验和分析的结果表明,在人脸识别中,该方法的效果明显好于其它方法。