多视点商品本体学习研究

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:fangaocang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网及电子商务的发展对商品信息和知识的共享提出了更高的要求,越来越多的应用性研究中尝试使用本体来解决信息交换时的语义差异问题,然而多数研究是建立在一个“假想”的商品本体之上,目前以商品数据和商品知识为描述对象的真实商品本体相对匮乏。尤其是现有的中文商品本体,不但在规模上达不到实际应用的需求,而且在设计上均忽略了商品认知的多视点特性,造成本体不能全面的描述商品知识,难以支持许多应用场景对本体的要求。为解决上述问题,必须研究如何设计多视点商品本体以描述商品认知的多视点特性,研究本体的学习方法以获取期望的多视点商品本体。基于上述两个主要研究目标,本文借鉴了现有的商品本体设计与本体学习研究成果,利用自然语言处理领域的方法和技术,对中文多视点商品本体建模和商品本体的学习方法进行了深入研究。主要的工作包括:多视点商品本体的建模与本体学习任务的确定。针对商品认知的多视点特性,提出商品主观知识的概念并建立了商品主观知识的分析指标,提出了商品知识结构模型;在此模型基础上,设计了多视点商品本体元模型对商品知识结构进行规范描述和形式化说明,由多视点商品本体的元模型所规定的知识内容确定了多视点商品本体的学习任务框架。基于大规模商品电子目录的商品间分类关系抽取。提出一种基于UNSPSC的商品概念间分类关系抽取方法,依靠UNSPSC中收录的商品与服务名称及其分级标准,构建以商品概念为基本单元,概念间分类关系为基本语义关系的多视点商品本体骨架。给出了商品本体的扩展概念集,还提出了基于组词特性的概念关系修剪算法进行整理。基于Web的商品属性概念的获取。提出了一种基于Web的商品属性概念获取策略。根据Web页面的结构化程度,对于显性页面块,研究了根据属性术语识别模板和过滤模板获取候选属性术语和短语的方法;对于普通文本块,提出了纯文本中属性术语分类的内外部特征,研究了基于SVM的属性术语识别方法,为保证属性术语识别的准确性,还建立了基于规则的启发式识别方法。基于属性匹配的商品间非分类关系的学习。提出了基于属性匹配的商品间非分类关系学习策略,采用基于词形和基于概念相似度的属性子集匹配方法,根据属性子集匹配结果,提出匿名关系类型判定规则。提出了基于决策树分类器的商品属性的自动分类方法,将商品属性划分到目标子集中。面向属性分布的商品主观知识的挖掘。提出基于已知视点类型文本的属性视点隶属度与属性关联度挖掘策略。针对未知内容和发布者类型的Web文档,研究基于内容的Web文本分类和基于风格的商品描述文档分类方法以识别文本的内容和视点类型。提出基于共现率的属性视点隶属度和属性关联度计算模型。多视点商品本体的应用实例研究。介绍了使用多视点商品本体的一个应用系统案例,阐述了商品本体在系统中的作用,介绍了该商品本体的构建方法。
其他文献
如何保证公积金的收缴及规范使用,实现资金的保值增值是住房公积金的财务管理目标。然而,目前实现这一目标存在一定困难,究其原因是公积金的财务运作模式存在问题。笔者认为,通过
研究有限时段非平稳的Markov决策过程的强化学习算法.通过引入一个人工吸收状态,把有限时段问题变为无限时段问题,从而可利用通常的强化学习方法来求解.在文献[3]提出的算法
建设部等九部委联合制定的《关于调整住房供应结构稳定住房价格的意见》(以下称《意见》),对住房建设项目的套型比例做出了硬性规定,即自2006年6月1日起,凡新审批、新开工的商品住
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
我国高职院校内部专业评估及指标体系构建是完善专业教学建设,培养出专业技能型人才的必要举措。专业评估是高职院校教育发展的需要,也是高职教育培养创新型专业技术技能人才
上悬式离心机是一种高速旋转大转动惯量的大型设备,由于物料粘稠度、料位高度等发生变化,很容易造成布料不均匀,从而引起设备振动,振动严重时损坏设备造成严重安全事故.本文
提出了一种新的on-policy强化学习算法,其基本思想是按照一定学习策略,利用κ(κ>1)步的信息来估计TD(λ)回报值,从而加快对行动最优值估计的更新.更新速度比SARSA(0)算法快,