领域语义知识库构建及知识服务方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:liongliong557
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算和大数据推动了一系列人工智能(Artificial Intelligence,AI)技术的落地和发展,使人们从信息时代进一步迈入了智能时代。但由于大数据本身存在的一系列问题(非结构化、非标准化、缺少语义关联、缺乏领域背景知识、质量不高等),使得大数据的价值并未被充分挖掘和利用。为实现对大数据的精准与精细分析,除了依赖领域相关的标准、规范、指南等以外,更重要的是依赖领域专业知识的支撑。目前,尽管大数据驱动的机器智能在一些感知智能方面已经达到甚至超越人类的水平,但其在认知智能方面的水平仍然很低。认知能力是人类独有的能力,认知智能的实现依赖人们拥有的大量领域常识知识。针对“机器可理解的”(machine-understandable)领域语义知识库的建模方法以及基于领域语义知识库的知识服务方法的研究,目前已成为人工智能及知识工程领域的研究热点。围绕领域语义知识库的构建,目前的研究主要集中在通用的方法学、工具集、知识获取、知识复用等方面。针对领域知识的表示,基于大量实践发现,还存在大量共性的语义映射问题亟待解决。针对知识服务方法的研究,目前还没有提出明确的知识服务模型,目前的研究主要集中在浅层的语义信息共享和语义集成方面。基于领域语义知识库,通过补充问题求解知识以面向领域应用提供深层次的问题求解服务的研究还比较少。为此,本文基于本体(Ontology)、语义Web(Semantic Web)、模糊理论等知识建模技术与理论,深入研究领域语义知识库构建中的语义映射方法、开放语义知识库的复用方法,以及基于领域语义知识库的知识服务模型和问题求解方法。本文的主要创新工作概括如下:(1)针对领域专家知识(简称“专家视图”)中普遍存在的一词多义(例如,同一资源名既表示概念又表示属性、同一属性具有多个定义域、同一实例具有多种类型、同一资源既是类型又是实例等)、多元(n-ary)关系(例如不确定关系、关系存在附加信息、同一关系存在不同方面的值、多个实例之间的多元关系等)现象带来的一些共性语义映射问题以及在提供知识服务时针对领域安全专家或信息拥有者的访问授权的共性语义映射问题,本文给出了相应的语义映射解决方案,总结了 10条本体建模约定,并对语义映射结果从语义理解、语义推理和语义查询的正确性几个方面进行了详细分析。语义映射结果表明,本文提出的语义映射方法可以确保语义理解、语义推理和语义查询的正确性以及提供知识服务时访问授权的细粒度安全性。(2)针对领域专家知识中的模糊知识的语义描述,本文提出了一种建模领域模糊本体和描述领域模糊知识的方法。首先,该方法完全遵循本体设计原则,从概念上澄清了模糊概念仍旧是本体中的一个概念,模糊隶属关系或模糊关联关系仍旧是一种语义关系。其次,该方法结合模糊理论、本体标准描述语言和SWRL来建模领域模糊本体,可复用已有的OWL(Web Ontology Language)本体编辑器和推理引擎。该方法通过“OWL2”实例值约束(individual value restriction)构造器来表征模糊概念的特征函数,通过实例值约束构造器和类逻辑交构造器对模糊概念或模糊关系进行模糊限定,通过SWRL规则集来描述隶属函数表达式。最后,该方法通过引入关系类来表示模糊隶属关系和模糊关联关系,通过SWRL规则集来向模糊隶属函数实例传递论域元素的值以及描述模糊隶属关系,通过规则推理运算和操作可实现隶属度的自动计算和模糊隶属关系的自动构建。评价结果表明,本文的方法更加完整、合理和有效。(3)针对Freebase开放语义知识库的间接复用,本文识别和讨论了直接从Freebase RDF dump中抽取某个领域的知识所面临的各种障碍。在从概念、知识表示模型和语义描述组件三个方面对Freebase知识库和基于本体的领域语义知识库进行完全语义映射的基础上,本文提出了一种称为“EdokFred”的方法,该方法一方面可以实现对Freebase RDF dump包的预处理,在尽可能缩减dump包的规模的前提下,同时确保各个主题域知识的完整性;另一方面可以实现从处理后的dump包中快速、准确、完整地抽取出某个领域的本体定义和实例数据,并将其转换为本体标准语言描述的形式。评价结果表明,本文的方法在处理结果、准确性、完整性、处理性能和可重用性等方面均优于现有的方法。(4)为基于领域语义知识库提供知识服务,本文提出了基于领域语义知识库的知识服务模型。以面向慢病患者的干预方案推荐和基于症状的常见疾病辅助诊断应用需求为例,采用本文提出的领域语义知识库构建方法构建了一个健康医疗领域的语义知识库。由专家参与构建了面向慢病患者的饮食和运动推荐模型作为补充的问题求解知识,评价结果表明,本文构建的健康医疗领域语义知识库可以满足推荐模型的需求,推荐结果基本符合患者的身体状况和干预目标需求。针对“3R方法”存在的问题和不足,本文提出了一种“IMP3R方法”,以提出的疾病辅助诊断算法作为补充的问题求解知识,针对随机选取的6种常见疾病的Top-1和Top-3命中率,本文的IMP3R方法均高于3R方法。与朴素贝叶斯分类和决策树分类方法比较,本文的IMP3R方法可以避免“冷启动”问题,可以快速支撑大量常见疾病的辅助诊断。
其他文献
研究背景及目的:作为肿瘤多学科综合治疗的一部分,近年来免疫治疗取得了很大进步,在众多临床试验中显示出较好的治疗效果。但是,只有部分对治疗敏感的患者可以从中受益。越来越多的研究表明,肠道菌群可以提高肿瘤免疫治疗的响应率。作为人体内主要的益生菌之一,双歧杆菌已被多项动物研究和人体临床研究证实,在机体免疫调节中起着重要作用。但是目前尚不清楚这一现象背后的详细机制。本研究中,我们使用具有低免疫原性特征的小
大范围提高煤层透气性是高效抽采煤层气(瓦斯)的关键。传统煤层增透技术如密集钻孔、水力割缝等单孔增透范围偏小、抽采效率较低;常规水力压裂技术受地应力束缚易形成单一裂缝,裂缝两侧增透“空白带”内遗留瓦斯在后续煤炭开采过程中易诱发瓦斯灾害等事故。如何在煤层内大范围均衡构造裂隙网络是实现煤层瓦斯全面高效抽采的关键。为此,研究团队提出了煤矿井下树状钻孔均衡增加煤层透气性的方法,即利用穿层钻孔作为树干孔,通过
大规模网络系统具有复杂的动态特性,其优化问题既十分重要又极具挑战性。与传统集中式优化相比,分布式优化具有可扩展性好、灵活性高、协作性强、隐私数据泄漏少等优点,因此被广泛应用于智能电网经济调度、传感器网络最优资源配置、多机器人系统定位等领域。近年来,基于多智能体协调技术的分布式优化算法受到人们的广泛关注。特别地,由于一些实际优化问题对收敛速率具有较高的要求(如微电网的经济调度问题),因此研究保收敛性
夏热冬冷地区冬季阴冷潮湿室内热环境恶劣,室内热环境具有分散、间歇和局部供暖的特点,人员长期生活在此具有一定冷暴露经历的环境中,形成了相应不同程度的生理适应性。因此,在此背景下如何准确评价该地区冬季室内环境舒适性,对该地区合理调控供暖具有重要意义。传统热感觉预测方法如PMV指标没有考虑人体适应性,而适应性热舒适模型建立在黑箱理论基础上,适用于自然通风建筑人体产生完全冷适应的热环境评价,对于具有不同程
钽合金是一种典型的体心立方(Body centered cubic,BCC)难熔金属,具有优异的力学性能、耐腐蚀性能以及良好的生物相容性,被广泛应用于电子工业、高温应用、化学加工、核工程、航空航天以及生物医学等领域。为获得钽合金的高性能制品,需对其在热机械加工过程中的微观结构演变、力学及耐腐蚀性进行系统研究。近三十年来,基于透射电子显微镜(Transmission electron microsc
自从1958年Modigliani和Miller提出MM定理开始,资本结构理论衍生出权衡理论、代理理论、优序融资理论以及市场择时理论等多个分支。国内外文献从不同角度探讨公司资本结构的选择、变动规律以及影响因素等诸多理论和实际问题,其中动态权衡理论在近年来受到诸多学者的认同和支持,逐渐成为资本结构研究的主流逻辑框架。动态权衡理论认为公司存在一个最优的资本结构,它不仅反映公司价值与风险之间的最优匹配,
可热处理强化铝合金具有优异的综合性能,是交通工具上常用的轻质结构材料。目前新能源汽车、高速列车等先进的交通工具发展迅速,对所使用的铝合金的性能要求不断提高。可热处理强化铝合金经过时效产生的析出相及其在晶粒内部和晶界的分布对合金的力学性能和耐蚀性能有很大的影响。塑性变形和热处理相结合的形变热处理工艺可以通过引入位错、细化晶粒和产生析出相来充分挖掘铝合金的强化潜力,是一种很有应用前景的加工方法。但是形
随着煤炭、石油等常规化石能源的消耗与日益枯竭,能源开发经历着从传统化石燃料向清洁和环境友好型新能源的过渡和转型。天然气水合物(简称水合物,又名“可燃冰”)是一种新型清洁能源,具有储量大、分布广、能量密度大的特点,被认为是未来具有应用前景的新能源之一。水合物资源的安全高效开发对于调整和优化我国能源供给结构、保障我国能源安全等具有重大战略意义。研究多孔介质中水合物的生成与分解特性及其关键影响因素,对天
新世纪以来,各国钢铁工业都面临着新的发展机遇和挑战。一方面,科技的进步使大数据和云计算在各行各业相继取得突破,冶金行业正经历着蓬勃的发展时期;另一方面,生态环境的变化向钢铁工业提出新的时代命题,使钢铁行业自身发展与新时代科学技术相适应,通过以钢铁制造流程物理系统的结构改进和数字化信息系统相互融合,实现钢铁企业生产过程中物质流与能量流的协同优化将势在必行。本文将钢铁企业煤气系统作为研究对象,采用信息
随着“德国工业4.0”和“中国制造2025”的逐步推广实施,国际市场竞争愈发激烈,传统制造行业正面临着巨大的机遇和挑战,迫切需要进行深刻的转型升级。然而劳动力成本的上升、产品附加值的偏低、个性化消费需求的增长,这三方面问题正制约着我国制造业的转型升级。大规模定制充分利用企业现有的各种资源,借助现代设计方法、成组技术、信息技术和先进制造技术等,根据客户的个性化需求,以大批量生产的规模,提供定制化的产