多分类器集成的汉语词义消歧研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:liyan76669956
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词义消歧长期以来一直是自然语言处理中的热点和难题,集成方法被认为是机器学习研究的四大趋势之一.系统研究了9种集成学习方法在汉语词义消歧中的应用.9种集成方法分别是乘法规则、均值、最大值、最小值、多数投票、序列投票、加权投票、概率加权和单分类器融合,其中乘法规则、均值、最大值3种集成方法还未曾应用于词义消歧.选取支持向量机模型、朴素贝叶斯和决策树作为3个单分类器.在两个不同的数据集上进行了实验,其一是选自现代汉语语义标注语料库的18个多义词,其二是国际语义评测SemEval-2007的中英文对译选择词消歧任
其他文献
干扰在测试系统中是无用信号,会在测量结果中产生误差。因此,要获得良好的测量结果,就必须研究干扰来源及抑制措施。
在刚刚过去的元旦那天.我收到了一张精美的贺卡。可爱的图案,小巧精致的蝴蝶结……这些让我感受到卡片制作者的用心。而最美丽、最打动我的。是那卡片外,另附的一张白纸上稚嫩的
针对内网海量数据存储安全问题,一方面,通过设计多协议安全文件系统MPSFS支持不同协议用户的访问,为不同用户提供统一的访问接口,实现用户高效和快速的数据存储和文件检索.另
从耕地持续减少、能源紧张导致粮食安全问题更为突出角度,思考从山地开发粮食问题,并介绍了一种有开发潜力的粮用果树——凤眼果。