半监督分类器融合的蛋白质互作用信息抽取方法

被引量 : 0次 | 上传用户:congrorm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类器性能和标注样本缺乏是信息抽取中的两个主要问题,并突出反映在蛋白质互作用信息抽取任务中。提出一种分类器融合的半监督信息抽取方法。基于词特征和模式学习的各自特点,将模式学习方法产生的模式与词性串进行序列比对,产生模式特征,并与词特征一起合成到机器学习算法中,使用K-最近邻算法进行半监督学习。实验结果表明,分类器融合方法性能较单个方法有明显提高,半监督模式下采用K-最近邻算法能有效利用未标注样本,优于自训练方法。
其他文献
GPS以全天候、高精度、成本低、操作简单、高效益等显著特点,广泛地应用于野外地质工作中,给定位提供了极大的方便,可是有的地质工作者面对诸多的参数计算和设置感到束手无策。其实把WGS-84坐标转换到北京54坐标或西安80坐标,虽然需要设置9个转换参数,但其中5个是常数,只有另外4个参数,即L0、DX、DY、DZ随工作区的变化需要不断调整而已。L0可以通过投影带编号或纬度直接计算,DX、DY、DZ有4
脂肪栓塞综合征是严重创伤、骨折的早期危重并发症之一。系由来自骨髓与其他组织的脂肪、脂类物质在乳化能力减弱、理化性质失常的血液中聚结成较大体积、栓塞于肺、脑、皮肤
西藏曲松县米穷拉金异常位于藏南Au-Sb成矿带上,发育有较好的Au异常。2014年西藏地勘局第二地质大队对其进行了异常查证。通过初步分析,认为异常区内发育的第四系更新统湖积物
位于四川盆地南缘的长宁剖面是蜀南地区龙马溪组的典型剖面。之前诸多学者已对该剖面进行了的大量的研究,但是在沉积学和层序地层学方面的研究还有待深入。该次研究通过对龙
公路工程计量是工程建设的一个重要工作内容之一,是确保工程质量得到有效控制手段之一,是控制项目工程投资与支出的关键环节,也是约束承包商履行合同义务的重要手段。基于公
本文介绍了一款自己开发的施工现场临时用水用电计算软件。
目标教学理论是上世纪60年代末美国心理学家和教育家布卢姆提出的。英语课程标准明确提出了初中英语教学的总目标:通过三年或四年的英语教学,使学生受到听、说、读、写、练的
主要论述了六道江铜(金)矿床地质特征,认为矿床的形成与燕山期岩浆活动关系密切,尤其是石英闪长斑岩是形成矿床的决定因素,在此基础上总结了矿床的找矿标志,指出了六道江铜矿及