论文部分内容阅读
人称代词消解是文本信息处理中的一项重要任务,目前,网络上大量涌现关于突发事件的新闻,针对这类语料的人称代词消解技术可以帮助实现网页文本的信息处理。分析了中文突发事件语料中人称代词的特点,提出一种基于语料库,运用最大熵模型与规则预处理方法结合的代词消解方法。实验表明,利用该方法,可使测试语料上算法的F值达到70.9%。