包装器相关论文
随着大数据的发展,互联网数据呈现爆炸式的增长。Web作为一种重要的信息载体,包含了各种类型的信息,而包装器的提出就是为了从杂乱......
随着计算机及网络技术的快速发展,各企业单位开发了大量的软硬件平台各异的应用系统,在各种应用系统下又积累了丰富的数据资源,如数据......
XML和它的各种扩展功能如数据模型、查询语言等是实现结构化方式的一种.使用扩展的标志语言XML,它是SGML的一个子集,是一种元语言,......
随着互联网技术的不断发展,XML正在成为Internet上应用程序之间数据交换的标准。同时由于XML灵活的数据模式和开放的数据访问可以为......
数据的存储和处理一直都是信息系统的中心,而数据集成则是信息系统研究的经典问题.随着信息集成的飞速发展,产生了越来越多的异构......
本文以异构数据源的集成为研究背景,简要介绍了目前异构数据集成所面临的问题及相应的解决方案;提出了基于CORBA技术的异构数据集成......
根据异构数据源的分类和各自的特点,本文提出了将非结构化数据源进行结构化的思想,提出了一种以模式转化模板为中心的包装器系统......
基于构件的软件开发(Component-Based Software Development CBSD)方法是继面向对象的设计方法之后,正在并逐步走向成熟的新的软件......
Internet的飞速发展使其成为日益重要和最具潜力的资源。WWW作为一种新的信息资源,为计算机领域新技术的产生开辟了新的领域,同时也......
随着因特网技术的迅速发展,网上信息成几何级数增长,如何自动处理这些海量联机文本信息成为目前重要的研究课题。文本信息抽取是指......
随着计算机网络的飞速发展和信息化建设的大力推进,各种网络中可供利用的信息总量正以惊人的速率增长。但这些为不同应用服务的信......
生产生活中信息量的迅速增长,使得人们对数据的需求不仅仅局限于本地数据源的数据,对于异地数据的需求量也与日俱增。异地数据的异构......
数据分析类系统存在着因用户需求多变导致的核心功能单元变化频繁的特点,使这类系统的开发、应用和维护比较复杂,重复开发现象普遍。......
Deep Web是指那些存储在Web数据库里、不能通过超链接访问而需要采用动态网页技术访问的资源集合。随着Web数据库的不断增长,通过......
随着当今社会信息化程度的不断提高,企业应用往往需要从大量异构、分布、自治的多数据源中提取数据,如何屏蔽底层异构数据源,将异......
作为在信息检索领域的一个研究热点,Web数据抽取技术已经日益被众多大学和研究机构作为研究重点。Web数据抽取亦称Web信息采集(Web......
Web信息抽取将Web中的数据抽取出来并表示为结构化的形式。动态网页是通过程序动态生成的页面。据统计,目前Web上的页面主要是以动......
随着Web的迅速发展,越来越多的网页可以通过表单提交来获取,这些表单提交所产生的网页是由Deep Web后台数据库动态产生的,蕴含了大量......
随着互联网的快速发展,Web上产生了大量与领域相关的信息,这些信息也成了人类获取知识的重要来源。互联网已经成为一个巨大的信息......
随着互联网的高速发展,Internet在我们日常的生活中扮演越来越重要的角色,成为我们生活和工作中必不可少的一部分。网络的高速发展......
随着互联网技术的飞速发展,Deep Web网站上拥有着海量的数据,并且在快速地增长,使Web成为一个巨大的数据源,这些信息要通过查询接......
随着数据存储技术的不断发展,许多企事业集团都积累了大量的异构数据源,遗留下在不同的数据源上用不同技术开发的应用程序。异构数据......
近年来,基于构件的软件开发(Component-Based Software Development CBSD)方法不断成熟并在软件生产中大量使用。构件能够支持大粒......
针对传统中介器/包装器( mediator/wrapper)结构上的安全问题,提出了一个多中介器的安全信息集成模型。该模型采用多中介器协作技术,根......
电力信息是包含多种数据模型的典型异构数据库,电力信息的集成对电力系统的运行决策具有重要的意义。文中采用中介器饱装器结构,基于......
随着信息技术的发展,Web上的数据日趋成为当今数据的主流,但是Web上的数据多是异构的,而越来越多的人需要访问各种异构数据,为了满......
农业信息的网站越来越多,如何自动从这些网站的有关页面抽取农产品信息,为用户提供一个方便、快捷和高效的信息查询,是一个值得研......
针对集成系统中集中式中介器效率低、可靠性差等问题,建立了一个多中介器协作的3层结构信息集成框架MMIA。提出了基于评估函数的中......
从海量Web新闻网页中抽取高纯度新闻,并以结构化的形式存储,是舆情监测、话题更新等研究的基础。本文提出一种基于噪音过滤包装器......
基于表格结构及列表结构Web信息源提出了web页面信息抽取的方法。可根据用户对信息的需求自主地从相关页面中抽取信息并将抽取信息......
将本体应用在信息集成框架中能够在语义层次上消除底层数据源的异构,但是本体只相当于一个知识库,在定义用户接口时,需要赋予其一个语......
摘要:随着网络上信息的飞速增长,网络已发展成为一个巨大的数据库,人们对快速准确地获取网页数据提出了更多的需求。目前,自然语言处理......
动车段(所)信息化是铁路信息化的一个重要组成部分,动车段(所)每个部门的信息就是一个数据源,由于各部门建立时间不同,导致了这些数据源均......
Web包装器是根据特定的抽取规则从特定的Web数据源执行数据抽取程序,设计Web包装器是Web信息抽取和集成的关键技术。详细阐述了一种......
计算机网络的迅猛发展使企业内部数据交换越来越频繁,然而,系统实现技术及实现时间上的差异造成了在不同的信息系统中存在着大量异......
分析并总结了导弹总体设计面临的应用集成问题。比较了目前主要的应用集成方法及其解决技术。结合集成框架技术、组件技术、过程建......
通过对各种Web信息抽取方式的分析,将一种新的抽取方法应用于电子期刊信息抽取.该方法首先应用文档结构相对路径结合节点内容特征......
Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的、Web信息抽取,针对Web网站的分类体系,提出了基于HTML......
基于现有网上论坛信息抽取的不足,提出一种面向属性的论坛自动抽取方法。该方法运用论坛概念模型(Ontology)自动构造包装器,较好地解决......
针对基于模板生成Web页的基本特点,结合Ontology知识,探索Deep Web垂直搜索中,复杂Web页面的Wrapper自动化生成的解决方案.对实际......
基于包装器的信息抽取方法只能处理一种特定的信息源,而且对网页结构的依赖性强.基于此提出了一种将中文标点符号和HTML树结构作为识......
探讨了语义网格上的一个面向服务的模型,模型中每一个网格服务均表示为一个含有领域知识的Web服务,详细介绍了语义网格的分层架构、......