基于领域本体的中文Web文本主题特征抽取方法

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:zhangyongqihx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
其他文献
目的探讨成人前臂盖式骨折的手术治疗方法、治疗意义及其临床疗效。方法对24例前臂盖氏骨折采用切开复位内固定法对其进行了手术治疗。所有患者术前均对其全身情况及前臂软组
较大型铸钢件由于壁厚,尤其结构拐角处热节突出,制定铸造工艺时多数都要设补缩冒口。传统水玻璃砂型或树脂砂型铸造此类钢件,其工艺出品率一般都不高。如果同时采用其他工艺措施
从分析军队中小型专业图书馆及其数字参考咨询服务的特点入手,指出了在军队中小型专业图书馆中开展数字参考咨询服务面临的问题,提出在传统参考咨询与数字参考咨询相结合、创办
目的探讨结肠镜检在老年人肠道疾病诊断中的价值。方法统计2008年1月—2009年12月期间我院行结肠镜检的1149例老年患者资料。结果在1149例患者中发现患肠道疾病814例,阳性发
衡量政府信息公开的标准有量、质和获取渠道三方面.目前我国政府信息公开的现状并不令人满意,而要改善政府信息公开的现状,就应该从这三个方面出发,包括但不限于改革现有保密
信息不对称理论是微观信息经济学研究的一个核心内容,信息不对称性不仅是绝对的,而且是普遍存在的一个客观事实.本文从图书馆信息不对称的形式出发,探究图书馆信息不对称的成