【摘 要】
:
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高。针对这个不足,提出一种
【机 构】
:
集美大学计算机学院,集美大学信息化中心
【基金项目】
:
国家自然科学基金项目(U1936114),福建省自然科学基金项目(2020J01697)。
论文部分内容阅读
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高。针对这个不足,提出一种特征加权的K-means算法进行优化。首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其次,优化初始聚类中心选择策略,选择距离较大的K个样本作为初始聚类中心,可有效避免样本的错误聚类及空簇问题。实验结果表明,在UCI标准数据集中采用加权K-means聚类算法可以有效减少迭代次数
其他文献
New generation of structure steel has been developed to meet the uninterruptedly increasing needs of the economic construction and development of society, and s
柳宗元的文章作为文学经典,取法广博,司马迁之文即是其中最重要的渊源之一。自唐代始,柳宗元与司马迁之间的师承关系,就广为人们所关注。柳宗元对司马迁及其文的推崇与参悟,
托马斯·哈代的作品以其充满悲剧元素而受到关注。他的长篇小说《无名的裘德》就是这样一部通过刻画悲剧主人公裘德的一生,而体现出作家悲剧意识的代表性作品。哈代于《无名
研究一类具有混合时滞的中立型Cohen-Grossberg神经网络。通过建立线性辅助方程,得到该神经网络存在唯一的概周期解的新结果,同时也给出此概周期解的存在范围。
Corus R,D&T和Corus过程工程部具有丰富的铸机改造经验,主要涉及不同程度的铸机改造和新铸机的设计.其工作基础在于实际经验和丰富的现场试验、数学模型和实验室研究基础,如喷
应用矩阵论和代数图论,分析l步信息脉冲牵引控制的多智能体一致性问题。把具有单个脉冲控制器的多智能体的一致性系统推广到只对一个智能体实施l步信息脉冲牵引控制的系统。
提出一种求解Riesz空间分布阶的分数阶扩散方程的数值方法。利用辛普森数值求积公式,将分布阶微分方程离散为一个多项分数阶导数的微分方程;利用四阶差分格式求解此具有多项
针对当下我国部分乡村公共空间设计存在文化特色缺失、非遗文化元素与乡村公共空间契合度不高和互动体验缺乏等问题,从非遗文化元素与公共空间设计关系入手,从政策、设计者和
采用远红外非接触测温和射钉法对武钢三炼钢的板坯连铸机典型二冷模式下铸坯的表面温度及凝固坯壳厚度进行了研究,发现通过矫直区进入水平段之后铸坯表面温度持续降低,机尾附
地方政府环境质量法律责任包括集体责任与个人责任,其个人责任基于行政首长负责制,由地方政府行政首长承担。行政首长承担的环境质量法律责任是一种无过错责任,包括行政责任