一种基于WWW的Ontology属性值自动提取方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：hulei_1188

【摘要】

：

属性值是描述Ontology中类的重要信息，但是当前关于属性值的自动提取的研究并不多。该文提出一种基于WWW的Ontology属性值自动提取方法。论文首先提出了一种在小规模属性值种

【作者】

：

赵庆亮穗志方

【机构】

：

北京大学计算语言学研究所

【出处】

：

中文信息学报

【发表日期】

：

2008年6期

【关键词】

：

计算机应用中文信息处理因特网互动方法属性值提取 computer application Chinese information processing

【基金项目】

：

基金项目：国家自然科学基金资助项目（60503071）,国家973资助项目（2004CB318102）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

属性值是描述Ontology中类的重要信息，但是当前关于属性值的自动提取的研究并不多。该文提出一种基于WWW的Ontology属性值自动提取方法。论文首先提出了一种在小规模属性值种子集的基础上，包含属性值的句子的选择与属性值提取互动的方法。这种方法利用互联网信息的冗余性，自动抽取并扩充目标属性值集合。然后，为避免人工构造属性值种子集，提出种子集自动生成的方法。我们设计实验来计算提取结果的正确率和召回率，此外，我们还通过将填充后的Ontology信息用于网页正文提取任务来展示Ontology自动扩充结果的有

其他文献

我爱云南的云和山

<正>~~

期刊

云南民歌艺术大师绕丝叠山对齐幻山里山云山自然

一种改进的Wu-Manber多模式匹配算法及应用

本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足，给出了一种改进的后缀模式处理算法，减少了匹配过程中字符比较的次数，提高了算法的运行效率。本文在随机选择的TRE

期刊

计算机应用中文信息处理多模式匹配后缀模式字符串匹配全文检索信息检索computer application Chinese informatio

天然气管道产业经济带的形成与发展

耗资巨大的"西气东输"工程已经启动,这意味着"气化中国"的构想正在变为现实,标志着我国天然气管道建设将进入发展时期。因此,研究与天然气管道建设相关的经济问题,对于加快天

期刊

天然气管道天然气资源产业经济带形成与发展天然气利用管道建设西气东输天然气工业天然气消费能源结构

一种支持多语言文本布局方向的文档处理模型

文档处理是文字处理的关键组成部分，针对多语言混合排版的需求，本文提出了基于“框”的支持不同方向的多语言文本布局的文档处理模型。该模型把时文本布局方向的处理封装在文档

期刊

计算机应用中文信息处理文档格式化文本布局方向文字处理computer application Chinese information process

汉语词典的快速查询算法研究

汉语词典查询是中文信息处理系统的重要基础部分，对系统效率有重要的影响。本文对汉语词典查询算法研究作了简要回顾，设计实现了基于双数组TRIE机制的汉语词典查询算法，并提出了

期刊

计算计应用中文信息处理汉语词典查询双数组TRIE双编码算法computer applicationChlnese information proce

基于配价的维吾尔语框架语义知识库的构建

本文阐述了以配价作为基本描写法、真实语料为事实依据的维吾尔语框架语义知识库（简称框架网FrameNet）的构建，该知识库在构建维吾尔语词汇及其所属框架的语义词典等诸多领域有着

期刊

计算机应用中文信息处理框架网维吾尔语配价computer application Chiriese information processing

信息检索中一种基于词语-主题词相关度的语言模型

本文提出一种基于词语主题词相关关系的语言模型TSA-LM （Term Subject Association Based Language Model ），它的基本思想是把一篇文档分成两个文档块，一部分是由领域主题词表中

期刊

计算机应用中文信息处理语言模型主题词词语-主题词相关关系词语文档-主题词归属关系词语主题词共现关系computer application

《知网》在命名实体识别中的应用研究

命名实体识别是自然语言处理领域的一项基础研究，它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别，提出了基于《知网》的两种改进策略来增强模型的泛

期刊

计算机应用中文信息处理名实体识别概念相似度《知网》最大熵模型computer application Chinese information pr

基于音素及其特征参数的维吾尔语音合成技术

首先建立了由维吾尔语中的单音素、双音素所构成的小规模语音语料库，设计了相应的拼接单元挑选算法，利用参数调整算法对拼接单元语音信号的时长、基频和短时能量等特征参数进行

期刊

计算机应用中文信息处理语料库参数调整语音合成时域平滑computer application Chinese information proces

中兴信息化系统集成方案

<正>当今社会是一个信息社会,信息在社会生活中扮演着越来越重要的角色。人们对信息的需求已不再局限于语音、传真等传统业务,开始逐渐向数字化、宽带化、智能化、网络化、个

期刊

信息化系统集成深圳市电信企业中兴系统

一种基于WWW的Ontology属性值自动提取方法

与本文相关的学术论文