论文部分内容阅读
迁移学习可以增强模型对微博等新的文本域进行序列识别的能力,但是现有迁移学习方法对不完备信息的处理能力有限,同时现有的为迁移学习服务的粒计算方法难以对文本序列域进行粒化.本文提出融合对应信息和标注信息的粒化方法,从而使粒计算方法可以用于处理文本序列的迁移学习问题,扩展了基于粒计算的迁移学习的理论和应用.本文首先通过模糊聚类方法表示出对应关系启发中的不确定性,并通过二型模糊集的形式建立融合对应信息和标注信息的跨域文本信息粒.然后建立粒隐马尔可夫模型,以由粗到精的方式处理信息粒.在微博语料和平衡语料上进行了大量的词性标注实验,正确率的提升证明了方法的有效性.