基于TF/IDF多因素改进算法的知识单元抽取研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:nml5136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深入分析知识研究的基本知识单元,对知识单元的概念、特性、载体及抽取过程做详细阐述,提出知识计量研究中的知识单元的定义与特性,对知识单元的独立性、组合性、链接性、多维性、外显性、可测性进行详细说明。根据知识单元特性以及中文文献特点,提出一种基于词长和位置考虑的TF/IDF多因素改进算法,以《半导体光电》期刊1999—2006年数据为实例,对比分析了传统TF/IDF特征词抽取方法与改进后特征词抽取算法,分析结果表明,基于词长和位置的TF/IDF多因素改进算法显著提高了知识单元抽取效率和准确性。
其他文献
2018年8月21日−10月9日,对宁夏贺兰山东麓砾石葡萄园酿酒葡萄(品种为‘赤霞珠’)进行分期采收。通过对各采收期葡萄果实中的还原糖、滴定酸、可溶性固形物、总酚、单宁和花
通过研究感性质量的适用性设计技法,探索符合我国市场要求的、适合企业研发需要的感性质量管理方法。
以番茄品种“金冠5号”为试材,设置2个日动态温度(T)水平即日最高气温/日最低气温分别为32℃/22℃和38℃/28℃、3个空气相对湿度(RH)水平(50%±5%、70%±5%和90%&#17
利用1970-2017年7个中国苹果主产省及周边210个气象站逐日降水资料和1km分辨率的数字高程数据,采用基于样条函数插值理论的专业气象插值软件ANUSPLIN对降水数据进行空间插值
[摘要] 目的 探讨漂白土、维生素B1联合血必净注射液治疗百草枯中毒的临床疗效。 方法 64例口服百草枯中毒患者随机分为治疗组及对照组各32例,治疗组在常规治疗的基础上早期用维生素B1注射液3 g加入清水10 000 mL洗胃,后再用清水反复洗到洗出液为清水样物为止,再嘱患者反复口服30%漂白土(先正达生产)混悬液(即300 g漂白土 20%甘露醇液250 mL及冷开水450 mL)导泻,在此基础
目的探讨窄带成像技术在大肠息肉诊断中的临床价值。方法2010年1月~2013年6月常规结肠镜发现88例110个直结肠息肉样病变,应用窄带及放大内镜观察其腺管开口类型,研究其与病理组
本文根据ISO 22000:2005《食品安全管理体系——食品链中各类组织的要求》,结合作者在以往HACCP认证审核工作中所了解到的企业实际应用情况,对于新标准中的几个条款如何理解与实