混合属性数据k-prototypes聚类算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:spcheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实世界中经常遇到混合数值属性和分类属性的数据,k-prototypes是聚类该类型数据的主要算法之一.针对现有混合属性聚类算法的不足,提出一种基于分布式质心和新差异测度的改进的k-prototypes算法.在新算法中,首先引入分布式质心来表示簇中的分类属性的簇中心,然后结合均值和分布式质心来表示混合属性的簇中心,并提出一种新的差异测度来计算数据对象与簇中心的距离,新差异测度考虑了不同属性在聚类过程中的重要性.在三个真实数据集上的仿真实验表明,与传统的聚类算法相比,本文算法的聚类精度要优于传统的聚类算法
其他文献
为解决坐、卧状态下老人突发失能检测失效问题,设计了基于视觉传感器的老人突发失能检测算法.使用包围盒选择性更新策略实现对老人静止状态下的检测.采用视频图像网格化处理将监控范围划分成多个子区域.统计老人进入不同子区域的次数和时间,并建立区域驻留时间高斯模型实现老人突发失能检测.实验表明,本文算法具有运行平稳,实时性好,无监控死角等特点,可有效检测独居老人坐、卧状态下的突发失能.
参数曲线曲面的参数化直接决定了其代数性质,如正则性,而在计算机辅助几何设计中,自交现象却是一类不能直接应用的非正则性问题.管状曲面作为一类重要的几何造型,主要研究管
同步技术是提高移动数据库系统性能的一项关键技术.依托完井移动平台,结合完井业务数据,提出一种基于操作日志的移动数据同步处理模型,重点分析了该模型中的日志序列的生成以
针对嵌入式数据库SQLite3没有完整的安全访问控制的问题,本文基于RBAC模型,结合SQLite3数据库内核源码,设计了多级角色,分析了其访问控制的实现方法与步骤,详细设计并实现了S
在基于Winnow算法的基础上引入混淆词和介词搭配的方法.首先通过混淆集获得训练集,对训练集进行预处理后利用文本特征提取方法获得特征词集,然后对特征词集进行Winnow训练得
MODV是一个通用的存储一致性模型动态验证工具,该工具实现了基于时间序的边界图算法,具有较低的时间复杂度.为了进一步提高MODV工具的性能,我们采用了多种方法对算法进行了性
认知无线电网络通过动态频谱接入来提高无线频谱资源利用率,而节点目标信道选择的优劣直接决定了频谱接入性能的好坏.本文首先综合考虑信道增益和空闲时间两种因素,设计以实
利用网格技术建设地震勘探集成环境高性能计算平台基础设施的过程中,监控系统不仅要为位于不同管理域、分布异构的高性能资源管理提供资源全局视图,方便对资源管理和控制,还要为
机会网络利用节点移动形成的通信机会来逐步传输消息.然而当机会网络应用在海洋上时,由于海域广阔,节点分布稀疏,所以船舶之间相遇通信的概率较低,同时由于船速较慢,固定航道
通过有效分析某医院抗生素处方行为,提出了一种基于数据仓库改进的近邻传播聚类方法,利用数据仓库透视出所需数据,而利用改进的近邻传播聚类方法在数据仓库的基础上聚类出具