半结构化文档集的结构化处理及其Web发布

来源 :第18届全国数据库学术会议 | 被引量 : 0次 | 上传用户:jenny18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先对结构化半结构化文档的特点进行了研究总结,提出了利用光验知识进行模式提取及文档集的批量结构化处理的模型,然后重点讨论了该模型中先验知识的表达和关键算法,最后结合作者主持开发的国家重点工程对文档的结构化处理及其应用进行了总结.
其他文献
在响应时间要求和很高的环境中,必须得到一个多项式时间近似算法,本文基于传统的方法和半结构化查询自身的特点,提出了半结构化语义缓存的查询贪心重写方法,满足了XML查询引
在新时代下,我国需立足基本国情,坚持实事求是、具体问题具体分析等原则,通过不同路径探索各地区特色小镇规划建设中面临的问题,探究可行的思路与方法,优化创新特色小镇规划设计,提
本文结合目前国内外对半结构化和XML物化视图增量维护的研究,提出了一种兼顾效率和易操作性的XML物化视图增量维护的算法,能够直接对XML文档进行处理,保持XML数据格式的特点,
在现代社会发展体系中,房地产开发项目占据着十分重要的地位,通过构建现代化房地产开发项目规划设计架构,可以提升房地产开发项目的针对性、科学性、实效性,满足现代房地产开发项
城市轨道交通是城市交通体系中必不可少的构成体系。轨道交通对于目前社会的应用价值很高,现有的交通规划依旧有一些不合理之处,特别是轨道交通与城市规划之间还存在着许多的问
本文提出了充分利用XML的结构信息与链接信息的文档结构链接向量模型SLVM,并以K-means聚类方法为例,具体讨论了利用SLVM模型,计算文档相似度聚类中心的新算法.
农村土地利用规划对特殊的历史任务有效承担,利用这一规划可以更好管理乡村空间,并且高度统一社会各个区域的建设活动。对项目合理指引,管理用地和建设规模,形成严格的建设要求,迫
在给数据挖掘这样的应用准备数据的过程中,面临着一系列数据清洗问题.然而要把数据清洗过程做得很灵活并不那么简单,已有的工具往往过于依赖特定的应用.该文提出并实现了一个
煤矿企业在进行煤矿开采时,要对机械装备进行合理应用,应用时,还要注意及时对机械装备进行维护。同时,煤矿企业还要积极创新,重视自动化技术的应用,用自动化技术来带动煤矿开采工作
本文提出了一个新的自动构造物化视图的“集成模式计算模型”,利用该模型,实现了面向异构信息集成环境的集成模式自动构造,提高了信息集成系统的整体性能.