【摘 要】
:
针对AP算法运算时间消耗过高,相似性矩阵参考度值影响聚类效果等问题,本文提出了一种基于Spark改进的AP算法,首先对无权的数据集应用融合的ECC(边聚集系数)和CD算法进行加权
【机 构】
:
吉林大学软件学院,吉林大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金项目(61772226,61373051,61862056).
论文部分内容阅读
针对AP算法运算时间消耗过高,相似性矩阵参考度值影响聚类效果等问题,本文提出了一种基于Spark改进的AP算法,首先对无权的数据集应用融合的ECC(边聚集系数)和CD算法进行加权处理,并根据加权的结果设置相似性矩阵的参考度提高聚类精度,并在Spark平台并行化改进AP算法减少运算时间。应用PPI数据,识别蛋白质复合物,并引入F值聚类评价指标对结果进行比较,实验结果表明:该算法在不同的PPI网络上均有较高的聚类精度优于clusterone等经典的聚类算法,并且提高了运行效率,有良好的扩展性。
其他文献
一、求方程所表示的曲线的轨迹问题例1已知点M(x,y),x,y∈R满足2√(x-1)^2+(y-1)^2=|x+y+2|,判断点M的轨迹表示怎样的曲线。解析:若将方程两边平方,化简后并不能直接判断轨迹是什么曲线,并且运
为了探究棒束通道内的自然循环流动特性,本文采用将三维计算流体动力学(CFD)软件STAR-CCM+与一维用户程序(User Code)耦合的方法进行研究。通过三维软件模拟棒束通道,一维自
先天性髋关节脱位是矫形外科常见的先天性畸形,治疗方法因患儿年龄不同、脱位程度不同而各异.早期诊断明确后可通过穿戴外固定支具而达到关节复位的目的,错过保守治疗的时期
目的:探讨亲情化健康教育与护理纠纷发生的关系。方法:通过护士各方面的培训,把亲情化融入健康教育的内容、形式、过程中。结果:亲情化健康教育为临床整体护理工作提供了有力支持