大数据中基于熵加权的稀疏分数特征选择聚类算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:luoxing1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高大数据统计及分析的效率,有必要对数据集合进行聚类,以减少数据集合维度,并去掉相似数据冗余。采用熵加权和稀疏分数特征选择相结合,一方面对异构数据进行局部结构划分,降低数据维度,对局部结构的特征重要性标记并排序,提高聚类精度,另一方面,提高聚类稳定性。实验证明,该方法对不同种类的大数据聚类具有较强的适用性。
其他文献
根据密集架底盘散件的结构特点和焊接工艺要求,确定了实用可靠的装夹方案并设计了相应定位元件;为了便于自动化控制,选择了气动夹紧方式并设计了相应的气动回路。考虑到顺序
通过种植耐盐碱树种、铺设排盐盲管及回填土中添加有机肥和稻壳混合物等排盐处理,探寻适宜浙南泥质海岸围垦区盐碱土的改良方法。结果表明,随着时间推移,土壤容重和含盐量逐
民族之间互助合作是我国各民族共同繁荣发展的必由之路。新疆塔城地区各民族杂居分布、经济互补、文化频繁交流,构成了族际互动结构性特征,族际合作的主要类型是自发合作。伴随
在日益复杂的环境中,尤其是在现今金融危机前提下,企业时刻面临着各种危机。预警是力求以最小损失和最低成本代价把危机扼杀在萌芽中,在危机预警阶段没有把危机处理好时,当危机不
对口支援是我国所特有的一种横向财政转移支付形式,具有中国特色的对口支援政策实施有效地减轻了地方的财政缺口,减轻了政府的财政压力,保证了受援地区的财政支出能力,为社会
目的采用密切值法综合评价天津市医疗机构法定传染病报告质量,为从不同层面提高全市报告质量提供科学依据。方法查阅2016年1—11月医疗机构门诊日志、出入院登记簿,抄录初步
目的探讨益胃汤联合西药治疗幽门螺杆菌相关胃炎的方式及临床效果。方法选取我院2012年1月至2014年8月收治的幽门螺杆菌相关胃炎患者共60例,随机平均分为对照组与治疗组,对照
2004年11月15日-19日,浙江省教育厅教研室和浙江省教育学会小学数学教学分会在湖州市举行了“浙江省教育学会小学数学教学分会第七届年会”。其间,南京大学哲学系教授、博士
阐述侯月线增运5000万t,建成亿t煤运通道的实践。为了侯月线的再次增运,指出目前存在的问题,并提出进一步扩能的措施。