基于GraphX的分布式幂迭代聚类

来源 :计算机应用 | 被引量 : 0次 | 上传用户:pjq521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决幂迭代聚类算法并行实现中存在的编程繁琐、效率低下等问题,基于Spark大规模数据通用计算引擎及其Graph X组件,提出了一种在分布式环境下实现幂迭代聚类的方法。首先,利用某种相似性度量方法,将原始数据转换成一个可以视为图的亲和矩阵;然后,通过顶点切割,把行归一化后的亲和矩阵切分成若干个小图,分别存储在不同的机器上;最后,利用Spark基于内存计算的特点,对存储在集群中的图进行多次迭代计算,得到这个图的一个切割,图的每一个划分子图对应一个类簇。在不同规模的数据集和不同executor个数下进行的实验
其他文献
齐河县在农业水价综合改革项目区内依次分步骤建立科学合理的农业水价形成机制,完善水价体系,探索合理的奖补机制,实现农田水利工程的良性运行,在提高水价与节约用水降低灌溉
相信很多朋友都有被鼓鼓囊囊的腹胀折磨的经历。怎么办?那就尝试一下以下的自我治疗。
阅读教学在小学语文教学中的地位举足轻重,而课外阅读更是语文教师一直探索实践的课题。文章以小学生为研究对象,从激发兴趣为学生的自主阅读保持动力,指导选择为学生的正确
吸烟成瘾又称为烟草依赖,是一种慢性疾病。烟草依赖包括躯体依赖和心理依赖两个方面。躯体依赖表现为,在停止吸烟或减少吸烟量后,吸烟者将会产生一系列不易忍受的戒断症状,包括对
蝙蝠算法是在对微型蝙蝠回声观察研究的基础上发现蝙蝠回声和优化目标功能之间的关系而提出的一种新算法。蝙蝠算法具有强大的搜索性能,但是其局部搜索相对简单,个体间缺乏信
用正交实验研究了Ni-La-P电沉积的最佳工艺条件,以此合金作阴极测得析氢阴极极化曲线,结果表明,合金电极上析氢速率比Ni电极上约大10倍,析氢电势正移300~400mV,显示出含稀土La
一真空蒸镀设备包括具有多个蒸发源和一加热器的一真空室。加热器加热诸蒸发源以实现在真空室内的至少一基片的一表面上的真空蒸镀。至少一蒸发源利用一有机材料,将包围诸蒸发
针对现有面部表情识别算法耗时长、收敛速度慢、分类精度低等问题,对LeNet-5网络的框架和内部结构进行双重优化和改进,并提出一种基于改进LeNet-5的面部表情识别方法。为了能够提取更加多样化的特征,同时提升特征表达能力,首先增加卷积层和池化层的个数,调整网络内部参数;其次,通过对卷积层、全连接层进行批规范化处理,提高网络模型的泛化能力;最后,3个池化层以maxpool_avgpool_avgpo
针对潍坊寿光建桥-洛城110kV线路工程造成的影响进行了分析,对防洪影响进行了综合评价,并对后续工程使用和管理提出了建议。
日前,国家发展改革委发布的《中国资源综合利用年度报告(2012)》(以下简称《报告》)显示,我国煤矸石、煤泥发电装机容量达2.8×107kW,相当于减少原煤开采4.2×107 t。