基于语义概念属性的文本聚类研究

来源 :中国科学技术情报学会,中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:jokylin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本处理中基于关键词的文本聚类方法的局限性,本文提出了基于语义概念属性的文本聚类.引入中的语义表示方法用义原定义语义概念,并作语义特征选取.经使用K-means算法和Bisecting K-means算法验证,均优于基于关键词的文本聚类.
其他文献
回顾我国科技查新工作产生和发展的历程后,作者分析了目前影响我国科技查新工作进一步向前健康发展的内在因素和外部因素,参照国外近年来的一些科技政策,提出了一些建议.
共享性是信息资源的一种天然特性,其实现的前提常常是不受人为的干扰和破坏.论文首先对信息资源共享静态博弈的出发点--稀缺性法则进行了分析,认为物质资源和能源资源的稀缺性表现在量的减少,而信息资源的稀缺性表现在质的降低.然后,论文从经济角度入手,构建了静态博弈模型,发现信息资源共享中的纳什均衡供给小于帕累托最优供给,且两者的差距随着参与联盟的经济行为者数量的增加而扩大.最后,论文在静态博弈分析的基础之
随着科学技术飞速发展,各类文献信息量急剧增加,高校图书馆文献资源建设与读者的文献需求之间存在十分尖锐的矛盾.开展文献传递服务已成为网络环境下高校图书馆文献资源共享的有效途径.本文探讨了文献传递服务的基本思想,分析了网络环境下,高校图书馆开展文献传递服务的必要性和现实性.在此基础上,提出了高校图书馆开展文献传递服务的措施.
文章对地市(州)级科技信息服务网络的建立、形成及现状进行了全面系统的回顾.对阻碍网站发展的问题进行了综合、阐述.文章根据网站的实际情况从五个方面进行了论述和思考,并从总结的角度出发,详细介绍自身工作中一些较为成功的经验;提出了网站建设、发展与之相应的对策,以期对我国地市(州)级的网络建设与发展有所帮助.
科技信息工作在长期为经济社会服务并取得重大成效的基础上,要紧跟时代步伐,迎接新挑战,就要进一步加强自主创新,根据区域特点和发展需求,建立科技信息服务平台,加强科技信息资源的建设和集成,为提升科技创新能力服务.
科技信息服务是国防科技自主创新中重要的环境影响因素.在对国防科技自主创新的内涵、特征、主体进行分析的基础上,对国防科技创新中科技信息服务的定位、目标和作用进行了界定,并探讨了科技信息服务在国防科技自主创新微观、宏观两个主体层次上的规律和特征.
为适应新时期科技发展的需要,科技信息工作要利用自身优势,创新工作思路和方法,为服务自主创新、建设创新型国家作出贡献.本文介绍了锡盟科技信息研究所为当地经济建设、科技发展提供服务,加强自主创新的一些思路和做法.
本文系统分析总结了青岛市科学技术信息研究所(青岛生产力促进中心)近几年改革以来,加强科技信息(情报)工作,为区域科技服务所取得的成绩和经验.以期今后更好地为区域科技创新服务.
信息抽取(Information Extraction)是一种应用性的语言处理技术,近年来受到越来越多的重视.在网络情报资源快速获取方面更是具有广阔的应用前景.本文针对信息抽取的内涵、网络情报信息源特点、信息抽取的技术难点、信息抽取前提、国外代表性信息抽取工具等方面作了较为详尽的论述并介绍了一种基于领域Ontology的信息抽取过程.最后,对网络情报信息抽取技术的发展趋势予以展望.
面对现代科研环境e-Science,科学家跨领域知识合作和新知识发现问题成为严峻的挑战.本文提出基于知识单元语义关联的知识发现方法,讨论了文献单元中知识单元的语义隐含关联关系,试验了基于谱变换的文本知识单元抽取方法,探讨了知识单元的本体表示和知识单元之间的语义关联的知识发现理论,软件试验表明这一方法鼓舞人心.