【摘 要】
:
Graphlets(图元)是指大规模网络中那些节点数目较少的连通诱导子图,在社交网络和生物信息学等领域有着广泛的应用。随着graphlets节点数目的增多,graphlets的种类数增长迅速
论文部分内容阅读
Graphlets(图元)是指大规模网络中那些节点数目较少的连通诱导子图,在社交网络和生物信息学等领域有着广泛的应用。随着graphlets节点数目的增多,graphlets的种类数增长迅速且结构变化复杂,快速估计大规模社交网络中所有graphlets的频率是一项挑战。由于精确计数的计算成本较高,目前大多用基于随机游走的采样算法来近似估计graphlets的频率,而这些算法大多只能估计不超过5个节点的graphlets,很难扩展到高阶graphlets。因此,设计一个估计精度高且能扩展到估计高阶graphlets频率的采样算法具有重要的研究意义。本文中,我们提出了一种基于最大公共子结构感知的社交网络graphlets采样算法 CSRW(Common Substructure based graphlets sampling via Random Walk)。给定graphlets的节点数k,CSRW首先感知并游走一个所有k-graphlets都共享的最大公共子结构2-path((?)),再从多个节点的邻居中随机生成下一跳节点,直至得到k-graphlets样本,从而以统一的方式估计所有类型k-graphlets的频率。此外,当graphlets节点数目k增加时,k-graphlets呈现出更复杂的拓扑结构。那些结构更稠密的graphlets在真实社交网络中很少出现,采样相对困难。为此,本文提出了一种基于两种子结构感知调和的社交网络graphlets采样算法CSRW2,以提升那些较少出现、结构更稠密的graphlets的估计精确度。给定阶数k(k=4,5),CSRW2首先分别采样子结构(k-1)-path和3-star((?)),再扩展得到两种样本,然后用比例放大法调和两种样本,从而可以适应graphlets结构的复杂变化并高效估计graphlets的频率。综合性实验表明,CSRW能统一地估计所有k-graphlets类型,其算法精确性优于当前代表性算法SRW2CSS和WRW;6,7-graphlets的估计结果也证明了CSRW的可扩展性。CSRW2也以统一的框架估计所有k-graphlets的频率(k=4,5),且相对CSRW来说,CSRW2更有利于估计那些出现较少、结构较稠密的graphlets。
其他文献
职业化是当今世界网球运动发展的主旋律,职业态度、职业技能和职业形象是网球职业化发展的内在要求,核心素养的提出为推进我国职业网球运动员融入职业化进程提供了契机。本文以职业网球运动员为调查样本,采用文献资料、问卷调查和数理统计等方法,以职业化进程中网球运动员核心素养的培养策略为研究对象,在澄清核心素养的理论内涵基础上,探析我国职业网球运动员核心素养的实践现状,提出加速推进我国网球运动职业化进程的基本思
视觉神经系统的非凡性能与视觉信息编码机制密切相关,但人们通常只关注于基于生理和心理的视觉神经功能探测与构建,或者只围绕着传统信息论编码机制展开应用研究,虽然上述研
肝癌发生率及死亡率均相对较高[1],近些年来,微波消融(microwaveablation,MWA)对于肝恶性肿瘤的治疗已被证明疗效确切、安全可靠,并可多次治疗,对于不愿手术或不具备手术适应
天然橡胶是一种重要的战略物资,主要来源是巴西橡胶树Hevea brasiliensis。炭疽病是巴西橡胶树的一种重要叶部病害,危害严重时会引起橡胶树落叶,影响天然橡胶产量。橡胶树炭疽病病原种类多样,其中Colletotrichum siamense是我国橡胶树田间主要病原种类。前期研究显示炭疽菌的脂滴包被蛋白CsCap20影响菌体脂滴的形成,并影响了附着胞的膨压和致病性。本研究通过酵母双杂技术从炭
厌氧干发酵技术能够处理总固体含量(TS)在20%-40%之间的有机废弃物,相比厌氧湿发酵具有用水量少、产气率高、沼液排放量少等优势,是目前我国农业废弃物资源化利用的主要研究方向之一。但由于物料含固率高,厌氧干发酵技术还存在搅拌困难、传热传质差、工艺调控难等问题。为了解决上述问题,提高产气效率,本课题以玉米秸秆(CS)和牛粪(CD)为发酵原料,研究了沼渣混合液回流比例、原料混配比例、TS等工艺参数对
中小企业在我国目前市场经济下已经成为社会发展的重要动力,其大部分面临的主要阻碍都是资金短缺问题,主要体现在融资慢、难、贵等问题。为解决融资问题,促进中小企业融资能力的提升,必须要结合中小企业融资的实际状况并积极应用多样性融资渠道。本文以LS企业为研究对象,结合企业生命周期理论,运用文献研究法借鉴前人研究成果深入学习理论知识;运用访谈法整体了解和深入分析LS企业不同生命周期面临的融资问题;分析LS企
伴随着互联网技术的迅猛发展,全球每天产生的数据量呈爆炸式增长,相关的大数据关键技术也得到大力发展,其中的云计算技术已经发展成为计算机产业界及学术界研究的热点。Hadoo
近几年来,越来越多的城市引进轨道交通以用来解决城市交通问题。而对于大型轨道交通网,鉴于出行需求的增长和出行便捷性,轨道客流量大幅增加,轨道站点变得愈发拥挤,这使得轨道交通的管理显得愈发重要。如果能把所有的站点分成不同的类型,再对不同类型的站点进行分析,会使得轨道交通的管理变得更加有据可依。城市的发展模式可以分为TOD(以公共交通作为引导的城市发展),SOD(用社会服务设施建设去引导的城市开发),A
微生物燃料电池(Microbial Fuel Cell,MFC)是一种既能输出电能,又能降解污染物的新型技术,是目前环境能源技术研究的热点。当前废水中的氮素污染比较严重,使用MFC技术进行废水脱氮已被证明是可行的,然而目前MFC脱氮仍然处于实验室阶段,主要是由于MFC电极与微生物之间的电子传递慢,降低了MFC的输出功率密度和脱氮效率导致的。本课题旨在优化单室MFC硝酸盐氮最佳处理浓度的基础上,制备
随着信息技术的高速发展,人们需要存储和管理的数据呈指数级增长,传统的本地存储已不能满足人们的需求。云存储通过“云”为用户提供数据的集中管理和存储服务,其方便快捷、