粒子群算法改进及其在数据挖掘中的应用研究

被引量 : 0次 | 上传用户:himail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,数据的急剧增长和人们对数据理解的困难形成了强烈的反差,数据挖掘技术便应运而生。聚类分析是一种最重要的数据挖掘技术,根据数据的内在特性将数据对象划分到不同的类中,使得同一类中的数据对象具有最大的相似性,而不同类中的数据对象具有最大的相异性。由MacQueen提出的K-means算法是解决聚类问题的一种经典算法,广泛应用于数据挖掘与知识发现领域。但是,K-means算法存在两大缺陷,一是K-means算法的聚类结果依赖于初始值的选取,二是基于梯度下降进行搜索常常使K-means算法陷入局部最优。在分析相关研究的基础上,提出一种基于粒子群和模拟退火(SimulatedAnnealing,SA)协同的K-means聚类算法,简称PSK-means算法,并将新改进的PSK-means算法应用在两个不同的系统中,本论文主要工作包括:(1)针对K-means算法和粒子群算法的缺陷,利用模拟退火算法的概率突跳性,提出一种基于粒子群和模拟退火协同的K-means聚类算法,克服粒子群算法易陷入局部最优的缺陷,优化全体粒子的历史最优解,进而优化聚类中心达到最优的聚类结果,并进行了仿真实验,验证算法具有良好全局收敛性。(2)将PSK-means算法应用在计算机实验辅助教学与质量评价系统中。在系统评价模块产生许多评价数据,包括对教师的评价和对学生的评价。论文以对学生的评价为例,先对评价数据进行预处理,得出学生的最终评分。再使用PSK-means算法对数据进行聚类,并对聚类结果进行具体分析。针对每一类学生在学习中存在的问题进行针对性的指导,可以大大节省时间,有效提高教学质量。(3)将PSK-means算法应用在山东省名老中医医案数据中。山东省名老中医医案系统中医案数据杂乱,包括冠心病和高血压等多种疾病。先对医案数据按疾病种类进行选择性提取,再对同一种病的药方数据使用PSK-means算法进行聚类,将药方按中医上的证型分类。聚类后的数据使用Apriori算法进行强关联规则挖掘,挖掘出不同证型的核心药方,为年轻中医医生提供学习参考,且对中成药的制作具有一定的价值。
其他文献
<正>肿瘤转移是恶性肿瘤的基本特征和重要标志,是大多数癌症患者的主要致死原因。肿瘤发生转移是由肿瘤细胞内在的特性改变所决定的,尤其与所处的微环境息息相关。
受传统文化和教育体制的影响,死记法是中国学生外语词汇习得的主要学习策略。该学习策略的根本问题,即学习过程的被动性和对学习主体创造性的束缚。作为解决问题的对策,笔者
当前,处于经济起飞阶段的中国,人民币面临着升值和国际化的两大趋势。稳定而坚挺的人民币币值会加快人民币国际化,而人民币国际化要求人民币币值稳定而坚挺。国际经验表明,货
<正>医院文化与医院品牌二者相辅相成、互相促进,医院的文化建设与品牌建设都是为了提升公立医院的"美誉度"和"信任度",以品牌理念为指导,以人为本,以病人为中心、以医疗为主
1960年以来苏俄所出现的后现代主义文学艺术,原本是部分文学艺术家在强大的意识形态和苏俄帝国意识压力下,无可奈何地选择消解苏俄主流话语的一种方式——借用既有的概念和措辞
乾嘉时期作为文人篆刻发展的高峰期,印人数量和篆刻成就较以往有了较快发展。在这些数量庞大的篆刻家群体中,以“布衣”身份从事篆刻创作的印人成就斐然,他们的篆刻风格和艺术主张深受身份属性的制约。本文以布衣印人群体的身份特征为切入点,通过考察布衣印人的篆刻心态和交流活动的各个方面来探析布衣印人的篆刻艺术特征。因生存的需要,布衣印人在对待篆刻的心态上,不再把篆刻看作文人寄情的“余事”,而作为安身立命的事业来
电器接线端子广泛运用于电器连接器领域,目前其仍处于手工生产阶段,还属于劳动密集型产业,但随着产品市场需求的迅猛增长以及劳动力成本的急剧增加,开发自动化或半自动化的接
情感是艺术作品的灵魂之所在,而色彩则是油画艺术表达情感的重要手段。油画自传入中国之后,色彩的被重视程度逐渐提高。中国近代的油画家多以西方的油画色彩观为基础,并在情
近年来,区块链技术不断渗入到金融、保险、物流等各个领域,其发展速度及应用前景也颠覆了我们传统的认知。区块链本身是一种数据记录的格式,会计本身也是确认、记录经济交易
数学概念是构成数学体系的基石,掌握小学数学概念是打基础的关键.在小学数学教学内容中,学生每接触一个新的知识点时,最先学习的一定是数学概念.那么,概念课怎么教?如何教学