基于英语枢轴的汉-越双语词典构建方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:bbboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从双语资源中抽取双语词典是一个重要的研究工作,一般需要大规模双语平行语料支撑.针对汉语和越南语,汉越双语平行语料规模少,双语词典获取比较困难,但汉语、英语、越南语单语语料比较丰富,而且具有汉英、越英双语词典.如何有效利用单语语料及汉英及越英词典抽取汉越双语词典是一个很值得探索的工作.本文提出了一种基于枢轴语言的汉-越双语词典构建方法.该方法首先利用单语语料分别学习汉语、越南语及英语词向量表示.然后以汉语-英语、越南语-英语种子词典作为弱监督信息,学习汉语-英语、越南语-英语对齐关系,以建立汉语-英语、越南语-英语的对齐关系.在此基础上,在英语枢轴词向量共享空间中通过对抗网络学习汉-越的对齐关系.最后在汉越对齐关系上抽取获得汉越双语词典.实验结果表明本方法比基于平行语料的有监督模型提升了3.24%的准确率,准确率达61.82%.
其他文献
中文新闻文本主题分类任务中通常只考虑字符粒度或者词粒度中一种粒度的Embedding,这往往会使得在特征提取过程中丧失了另一种粒度的特性.本文针对中文新闻文本主题分类任务,
深度神经网络在多个领域应用广泛,但随着数据量的增长以及模型复杂度的提高,造成的影响是训练效率和模型精度的下降,对于深度神经网络的并行化研究可以有效解决这一问题.在现
区块链智能合约是运行在区块链网络中的代码,它能够根据外部环境条件自动执行相应的规则,完成对应的交易和数字资产的转移.Auction合约是一个公开拍卖的智能合约,广泛应用到
采用西艾克(VDS长春地辛),环磷酰胺(CTX),阿霉素(ADM),顺铂(PDD)组成CAPV方案对55例非小细胞肺癌进行联合化疗,其中ⅢB期34例,Ⅳ期21例,CR3例,PR28例,总有效率为56.3%,其中腺癌44例,CR3
目的: 探讨肺癌外科治疗中应用循证医学的程度. 方法: 以我医院胸科1999年度225例肺癌外科手术患者为研究对象,居于美国肿瘤临床协会提出了临床证据可靠性的5个级别作为标
会议
目的: 体外扩增HER-2/neu过表达乳腺癌患者来源的树突状细胞(dendritic cells,DCs),诱导特异性细胞毒反应(CTLs),观察其体外抗肿瘤免疫作用. 方法: 分别从HER-2/neu过表达乳
会议
根据(?)党中央指示,为了达到中西医学合流的目的,必须贯澈中西医师大协作的精神,我院中医科与妇产科教研组,从今年春季开始,互相协作治疗崩漏症(功能性子宫出血)。这项协作
针对布谷鸟搜索算法收敛速度慢、种群多样性低、高维寻优能力弱、开发不均衡等缺点,提出一种交互信息的动态选择布谷鸟算法(Ⅱ-DSCS).首先,在莱维飞行阶段,分别从种群整体、
目的: 探讨放疗、或放化疗对肺癌的疗效. 方法: 对本院从1983年1月至1992年12月底共收治经病理证实950例肺癌进行分析.放疗采用CO60-r线或10MV-X线.大野前后对穿照射40Gy/
会议
本文从分析常规天气形势和影响系统出发,利用v-4 θ图作为工具,对福建省2005年5月5日~6日强对流天气过程进行诊断,认为v-4 θ工具在预报中有一定的指示作用.