基于WEB的林产品信息资源整合方法研究

被引量 : 0次 | 上传用户:ljvael
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于高速互联网(INTERNET)链接的分布式WWW服务在很短时间内便产生了大量的信息。随着时间推移,在WEB页面中存储的信息在互联网的各个站点中不断地进行着运动,使得相关领域的信息具有了海量且离散的特点。以WEB为存储介质的信息所具有的这些特征给用户搜索信息带来了不便;同时,大量不完整的信息充斥在各个网站中,使相关领域的从业人员无法判断信息的真实性和有效性。为了解决这些问题,本研究提出了WEB信息整合的概念。在此基础上,通过相关技术地引入和创新,对行业领域内以WEB为存储载体的信息从发现、组织和定位三个方面进行了整合方法的探讨,并建立了WEB信息整合的模型。在实践阶段,使用该模型及其中包含的方法对互联网网站中的林产品信息资源进行了整合。林产品信息资源WEB信息整合的具体实践方法包括以下三个方面。(1)信息源的发现。通过对与林产品相关领域内不同类型网站WEB页面的特征分析后,提出了一种基于关键资源的网站识别算法(TD-SVM),用于判断网站的类别。并通过网络爬虫程序和TD-SVM算法对互联网中提供林产品信息资源的网站进行了识别与发现,为林产品WEB信息整合提供了信息源的基础。(2)信息的组织。在对林产品信息资源的信息组织的过程中,构建了林产品信息资源的知识分类体系。以该分类体系为基础,通过改进特征抽取算法的朴素贝叶斯分类器对抽取的林产品信息资源进行了多层次分类,从而完成了对海量林产品文本信息地有序化组织,为林产品信息资源的整合提供了数据基础。(3)信息的定位。信息定位的过程中从包括基于语义扩展的信息检索和对林产品信息资源知识库中的知识发现两方面进行讨论。具体实现过程为,通过引入本体对林产品信息资源进行知识建模;用改进的本体概念节点相似度算法对检索词进行语义扩展;使用手工标引的方法将林产品流通领域的规则扩展到知识模型,然后使用描述逻辑从林产品知识模型中推理出隐含的知识,最终实现知识层面的信息整合。本研究提出WEB信息整合模型以及涉及到的方法对林产品信息资源从信息发现、信息组织和知识发现三个层次上进行了探讨和实践。该模型与方法对其它领域的WEB信息整合的实践活动具有一定的参考价值和指导意义。
其他文献
我国集中式空调系统生物污染问题日益严重,亟待解决。本文通过对集中式空调系统生物污染特征、防控技术及标准规范文献调研,系统分析了集中式空调系统中易于滋生微生物的部件
语文教材作为语文教学的主要载体,是否能够顺利被执行是至关重要的。教材选文的合理性也直接影响学生的理解掌握情况,从而影响教学效果。因此,在现行高中语文教材中,文言文部
目的:探讨快速康复外科(fast track surgery,FTS)理念在结直肠癌患者围手术期中的应用效果。方法:将80例结直肠癌手术患者分为常规护理组和快速康复外科护理组各40例,比较两
目的探讨6-24月龄正常生长发育的婴幼儿视觉强化测听(Visual reinforcement audiometry,VRA)具体测试方法及技巧;获得6-24月龄正常婴幼儿视觉强化测听的最小反应阈值(Minimal
[目的]:运用实时荧光定量PCR法,建立稳定、快速、准确的运动神经元生存基因(survival motor neuron 1, SMN1)的定量方法,并将其运用于脊肌萎缩症(spinal muscular atrophy, SM
为了预防灾害发生,保证市域轨道交通一体化系统安全运营,通过对市域轨道交通一体化系统致灾因素的分析,剖析了致灾因素在检测预警系统构建中的作用以及市域轨道交通一体化检
微课视频已经广泛应用于课堂教学之中,随着手持移动数码产品和无线网络的普及,基于微课的在线学习越来越普及,微课视频已经成为新型的教学模式和学习方式的重要学习资源。本
学生事务管理工作是高校管理工作的重要组成部分。在高等教育大众化、经济信息全球化、高校学生多元化、评价体系国际化的今天,我国高等学校培养出的人才在国际上的竞争力还
户口调查是历代统治者都非常重视的政治举措,对于国家政权统治和巩固具有相当的重要性。历史上户口调查的基本目的主要是征税、征兵和维持社会治安。1906年至1908年,清政府在
档案保护工作的首要任务就是如何通过档案工作者建立和执行科学的保管、利用制度,同时采取以防为主的技术方法,防止和减缓档案载体的损坏。