【摘 要】
:
加权异构信息网络(Weighted Heterogeneous Information Networks,WHIN)是图模型的扩展,具有异构性、语义丰富性和关联性,有更好的语义表达能力,被越来越多地用做数据表示模型。大数据时代下,相似性查询处理技术得到广泛应用,是目前数据管理技术的研究重点之一。图编辑距离(Graph Edit Distance,GED)最常用于度量图模型的相似度。然而,GED仅能
论文部分内容阅读
加权异构信息网络(Weighted Heterogeneous Information Networks,WHIN)是图模型的扩展,具有异构性、语义丰富性和关联性,有更好的语义表达能力,被越来越多地用做数据表示模型。大数据时代下,相似性查询处理技术得到广泛应用,是目前数据管理技术的研究重点之一。图编辑距离(Graph Edit Distance,GED)最常用于度量图模型的相似度。然而,GED仅能度量无权图的相似度,并且GED的计算是一个NP-Hard问题。本文首先定义了加权异构信息网络编辑距离。然后,提出了星型结构映射距离和加权元路径映射距离的计算方法来得到WHIN的编辑距离的近似值。此外,本文分析了两种映射距离与编辑距离的关系,得到了编辑距离的上下界,用于加权异构信息网络相似性查询的过滤验证。实验结果验证了上下界过滤算法能够提高相似性查询的效率,同时也验证了映射距离作为编辑距离的近似值,在结构特征较强的网络相似性应用上有着很好的性能表现。在加权异构信息网络规模较大时,使用映射距离进行相似性查询的效率会很低,因此本文提出了一种基于特征向量的加权异构信息网络相似性度量方法。本文通过对WHIN的结构和内容进行分析,提出了结构向量和内容向量的计算方法。通过合并向量的方式将网络转换为特征向量。本文通过计算两个特征向量的相似度来得到两个WHIN的相似度。实验证明,特征向量的计算效率极高,有着良好的拓展性,在实际应用中使用特征向量相似性计算方法进行相似性查询有着不错的准确率。在实际应用中,无论是编辑距离还是特征向量都不能很好地表达两个WHIN之间的语义相似性。因此本文提出了一种基于特征结构的WHIN相似性度量方法,定义了能够表达网络语义的特征结构,将WHIN转换为特征结构序列。本文通过对特征结构序列中的元素进行分析,提出了一种加权匹配的特征结构序列相似度算法,提高了特征结构序列相似性查询的精度。实验证明,本文提出的复合特征结构比基本特征结构更能体现现实语义信息,特征结构序列的提取算法有着良好的拓展性,特征结构序列的相似度算法在强语义网络相似性查询应用中也体现出了出色的查询效率和查询准确率。
其他文献
基因表达调控是治疗疾病和遗传性疾病的一项很有前途的技术。现有的基因调控技术大多是不可逆的,但DNA甲基化是可逆的。有一个稳定的载体将甲基转移酶负载到核酸酶中对于DNA甲基化的成功是非常重要的。在这项研究中,我们研究了新的AGO1与DNMT3a3l甲基转移酶的融合,并将其装载到细胞核中,从而实现基因的甲基化。我们鉴定了未甲基化的靶基因并开发了基于AGO的甲基转移酶融合蛋白,研究了其通过靶DNA甲基化
碳纳米管因具有高长径比、高机械强度以及良好的物理化学稳定性等特点而被广泛研究。在真空电子学的研究中,基于碳纳米管的冷阴极技术正不断发展,在具有快速启动、结构紧凑等特点的基础上已逐步实现了大电流密度、高稳定性的电流输出,并逐步被应用在基于冷阴极技术的X射线管、电离真空计等器件的研究当中。但是要使碳纳米管阴极实现在以行波管为代表的微波功率器件上的应用,由于对电子注层流特性要求较高,还需要结合冷阴极的特
颗粒体系是由大量粗颗粒堆积形成,是复杂的多体相互作用体系,呈现出颗粒尺度的结构不均匀和动力学不均匀性的基本特征。颗粒体系的基本特征决定了从基本理论到实验手段上,表征与建立颗粒材料结构与性能的相关性都极其困难。现有测试分析手段所描述的颗粒系统组织结构过于简单化,缺乏对颗粒结构和动力学的真正认识,从而制约了颗粒体系研究的发展。因此,开展颗粒体系结构和动力学性质的测量,是理解和认识颗粒体系重要物理和力学
孤子和异常波的新颖动力学研究是非线性科学领域中的前沿课题之一。孤子概念的提出最早可追溯至1834年,其年苏格兰人罗素在爱丁堡附近的运河中首次观察到了波形稳定的水波孤子。其后,特别在20世纪60年代以后,由于激光器的出现、新材料制造技术的成熟以及超快诊断技术的不断涌现,光孤子科学得到了迅猛的发展,并迅速应用于实践中,如远程光纤通信、光存储和全光开关等。广义上讲,异常波(rogue wave)可认为是
光学层析成像是一种典型的非侵入式医学成像技术,其基本原理是,用近红外光照射生物组织,使光子在生物组织内被散射和吸收,用高精度仪器测量组织体表面的光强分布信息,再采用稳定的重构算法重建生物组织的光学参数,光学参数的高对比度表明生物组织体内存在某些异常信息。光学层析成像的数学模型通常为偏微分方程初边值问题,根据空间尺度的不同,常用的偏微分方程模型包括Maxwell方程组、辐射输运方程和扩散方程等。本文
两相流动中的散粒体系统颗粒破碎研究是当前许多领域关心的问题,该问题对于发射装药发射安全性研究具有重大意义。发射药床的挤压破碎是评定发射装药发射安全性的核心问题,对此的一般性研究是单独采用离散元法模拟颗粒、散粒体系统及内部颗粒的破碎,以动态挤压模型代替实际工程中的燃气推动作用,未考虑流体作用的复杂过程,本文的创新性在于还原实际工程中的气体冲击荷载,将复杂的气固相互作用考虑到发射药床的运动研究中。本文
在量子通信中,一般使用量子态作为信息的载体,即用量子态来编码信息。要有效地实现量子通信,就必须能准确的从所传递的量子态中提取编码的信息,也就是能很好的识别携带信息的量子态。而量子态在经过信道传输后,由于信道噪声的影响,原本正交的两个量子态会变非正交乃至近乎重叠的态。所以如何高效可靠的识别非正交的量子态,是量子通信中必须解决的问题。量子态识别的效率和可靠性直接决定了量子通信的质量。而应用量子信息、实
热传导过程中的反问题在工业领域中有很多重要的应用。例如窑炉、传热设备以及高温高压设备(如氨合成塔及大型乙烯装置中的废热锅炉等)中,由于涉及到高温高压的恶劣环境,一些物理参数比如热传导过程中的内部源项,热传导率,热传导过程的初始温度等无法直接测量。人们通常可以利用其他可测量的温度场相关数据通过数学上的反演方法得到这些未知参数,进而获得热传导方程的解,由此描述热传导过程。这类问题是典型的热传导方程参数
Drazin逆是一类非常重要的经典广义逆,在复矩阵,Banach代数,C*-代数等领域已经取得了相对完整的结果.Clean环研究起源于模的消去性问题,而在研究模的消去性问题中最重要的问题之一是研究环的exchange性,这方面的研究成果非常丰富.Clean环与Drazin逆有紧密的联系,在Drazin逆和clean环的研究过程中,吴藏和赵良引入了中心Drazin逆,中心群逆以及中心clean元的概
本文主要研究有限维半单拟三角Hopf代数上的广义Frobenius-Schur指标,我们定义了有限维半单拟三角Hopf代数上的一类广义Frobenius-Schur指标,并通过研究这类指标的某些算术条件及性质来间接获取相关拟三角Hopf代数的结构信息.本文主要分为以下四个部分:首先给出有限维半单拟三角Hopf代数上的广义Frobenius-Schur指标初始定义并根据定义计算了 4阶以下循环群代数