【摘 要】
:
双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。该文提出一种面
论文部分内容阅读
双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。该文提出一种面向单一双语网页的双语资源挖掘方法,该方法重点采用了以频繁序列模式为特征的SVM分类方法,实现了包含双语资源的单一双语网页的筛选与识别,并以此为基础挖掘具有对译的双语资源。实验结果表明,该方法能够有效改进双语资源挖掘的质量。
其他文献
以丙烯酰胺(AM)、2-丙烯酰胺-2-甲基丙磺酸(AMPS)、甲基丙烯酰氧乙基二甲基十二烷基溴化铵(AQ12)和乙烯基三乙氧基硅烷(VTEO)为原料,采用水溶液自由基聚合法合成了ASQV系列四
该文引入框架知识思想,对框架知识的构成过程进行了举例分析,并根据框架知识的构成、结构描述、内部组织、内部表示等,研究了藏文字框架知识表示的若干问题,构建了藏文字框架
训练语料库的规模对基于机器学习的命名实体间语义关系抽取具有重要的作用,而语料库的人工标注需要花费大量的时间和人力。该文提出了使用机器翻译的方法将源语言的关系实例
经国务院批准,中国中文信息学会将于2010年8月23日-27日举办“第23届国际计算语言学大会”。会前会后有Tutorials和Workshops。经大会筹备组一年多的不懈努力,现已步入正轨。
重质化、劣质化是未来原油供应的主要趋势,经济环保的渣油加氢技术正逐步成为渣油加工最主要的技术手段,目前,固定床渣油加氢技术应用最为广泛。主要分析了国内外固定床渣油