核化K均值聚类算法的改进及其在选课系统上的应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:w198911154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为一种无监督的学习方法,是最重要的数据挖掘工具之一,其重要性及与其它方向的交叉特性在数据挖掘、机器学习等各领域中得到广泛应用。聚类分析的目的为通过寻找数据中隐藏的数据结构,将获取的数据按一定的约束和判定准则聚成不同的簇,使得同一簇中数据点间的相似性大,不同簇间的相似性尽可能的小。K均值聚类算法是聚类问题中比较经典的算法,由于其简单易行、效率高、适应性强等特点,在机器学习领域的应用十分广泛。但是,该算法对于处理高维非线性可分数据并不是十分有效。由于现实世界的数据普遍复杂,具有高维性和非线性,因此对高维非线性的聚类算法的优化已经成为目前重要的研究方向和一项极具挑战性的任务。核化K均值算法则是在K均值算法的基础上进行改进的聚类算法,通过把核函数引入聚类算法中,将非线性可分的数据通过核函数映射到高维空间中,提高聚类算法在高维数据上的性能。针对以上问题,本文的研究工作主要对核化K均值算法的性能改进以及将改进的算法在选课原型系统中的选课处理模块中进行应用,具体的工作如下:(1)利用指示矩阵的性质,本文提出了一种核化K均值聚类模型的非凸松弛模型来解决图像和文本数据聚类问题,并分析了该模型与正交非负矩阵分解模型,非负谱聚类模型等之间的关系。(2)为了更好的解决提出的非凸优化模型,设计了一个简单但鲁棒的数值算法。首先将原始矩阵变量分裂为两个变量分别满足正交性和非负性,再使用迭代算法交替投影到Stiefel流形和非负子空间来寻找最优解。(3)大量的实验表明,相比一些现有的方法,本文提出的算法可以高效地对高维非线性数据进行聚类,在人工数据和现实世界的数据上都得到了更高的聚类精度及稳定性。(4)基于论文提出的聚类方法,将改进的核化K均值算法在选课系统的选课处理模块进行应用研究,辅助学生进行课程的选择。
其他文献
小麦是世界主要粮食作物之一,富含淀粉,淀粉占其籽粒质量的75%左右,广泛应用于各种面制食品加工中,是陕西特色食品凉皮和擀面皮的主要原料。在擀面皮生产中,自然发酵是一道必须工序。自然发酵作为一种传统的食品加工方法,可以改善产品口感、延长货架期。然而,自然发酵对小麦淀粉特性的影响尚未见报道。为此,本文模拟擀面皮加工方式,通过和面、洗面筋获得淀粉,将淀粉浆液自然发酵不同时间,研究了自然发酵对小麦淀粉结构
乳品是人们日常生活中经常食用的食品,其中含有丰富的营养素。乳品的质量与安全问题的核心是控制好乳源,快速准确地检测乳品掺假具有十分重要的意义,事关经济利益和安全问题。相比于牛乳,羊乳以其更高的营养价值受到越来越多消费者的喜爱。为了保护羊乳及其制品的质量,确保消费者权益不受侵犯,为羊乳产业走向国际市场开辟道路,同时避免技术性贸易壁垒,羊乳及其制品的在生产销售过程中对原料及产品的纯正性检测是一个迫在眉睫
随着互联网技术的发展和各种终端设备的出现,人们获取信息的方式、生活的方式发生巨大的改变。分类信息平台、电商平台的出现,给商业带来了巨大的发展机会,同时伴随着风险。各种虚假的信息充斥在我们的生活中,用户无法分辨信息的真实性,给社会带来了负面影响、给人们带来了经济损失。交易平台通过为用户提供第三方支付、保险、评论等功能提供信任来保障交易,但使用这些功能的时候,个人信息可能泄露,可能遭遇虚假的信息与交易
风电机组通常安装在环境恶劣的偏远地区,长期受到雨雪、沙暴、雷击等因素的影响,容易发生故障,其运行过程中的健康状态至关重要。风电齿轮箱作为风电机组设备中的关键部件,在风机传动系统中占据重要地位,其健康状态直接影响到风电机组的使用寿命。因此对风电齿轮箱进行状态监测诊断,是一个重要的研究课题。目前,风电齿轮箱的状态监测诊断主要采用数据采集与监测系统(Supervisory Control and Dat
半导体异质结在光催化制备氢能源和光伏发电等领域表现出了强大的潜力,被认为是最具有前景的新能源制备材料之一。然而目前半导体异质结种类繁多、装配技术复杂,筛选具有优秀性能异质结的实验工作量大且难度高,急需理论工作的指导。半导体异质结的光催化和光伏性能主要取决于其电子结构和光学性质。基于密度泛函理论(DFT)的第一性原理计算能有效预测以上两种性质,是研究半导体异质结光催化和光伏性能的强大工具。本文选取B
阻抗源逆变器(Impedance source inverter,ISI)作为单级拓扑结构,具备升降压调节和逆变输出能力,且允许桥臂直通,克服了传统逆变器在电压调节范围、可靠性等方面的固有缺陷,被广泛应用于电动汽车、风电、光电等新能源领域,是当前最具发展前景的逆变器拓扑之一。新能源领域阻抗源逆变器常工作于极端环境,可靠性和谐波问题突出。本文以提高阻抗源逆变器可靠性和输出谐波性能为研究目标,对不同调
风能资源的波动性与随机性导致风电发电功率呈现随机性与间歇性,大规模风电并入电网会对电力系统的运行产生较大影响。为了解决由风的波动性与随机性导致的风电并网问题,提高风电利用率、推动新型可再生能源的发展,认识到风电和水电天然优势互补,风水发电协调运行是促进新能源消纳的有利途径,本文从风水发电联合运行入手,考虑到气象预报是风水发电调度的关键支撑环节,气象预报的不确定性直接影响到风力发电与水力发电的输出功
在光学三维测量技术领域,双目视觉和结构光技术被广为采用。双目视觉在弱纹理区域以及重复纹理区域进行立体匹配时容易产生误匹配点,导致重建精度较低,而在结构光技术中,投影仪标定精度低,且极易受光强影响。近年来提出的双目结构光则结合了两者的特点,解决了上述问题,但也存在一些仍亟待解决的问题。双目结构光和双目视觉一样,存在遮挡问题。从匹配算法的角度而言,遮挡区域的像点在目标匹配图像中没有对应的匹配点。此外,
一直以来,压电振动能量转换装置的研究用以解决无线传感器网络的能源供应问题。传统线性压电振动能量采集器结构虽简单,但能量转换频带窄,仅在环境振动与采集器共振频率相匹配时,才能产生高电压输出。鉴于现实环境中的振动频率是随机波动的,而非一个稳定值。为提高能量转换性能,需要拓宽采集器的共振带宽或使采集器共振频率可调。对此,本文提出了一种基于折纸耦合的宽频带非线性双压电悬臂梁能量采集器,其在线性阵列原理基础
随着互联网技术的快速发展和“互联网+”行动的实施,各种应用程序广泛使用。互联网已经渗透到人们日常生活的方方面面,然而,人们在享受科技带来便利的同时也面临着许多信息安全问题。在现有的网络安全技术的防护下,黑客假冒合法用户入侵系统进行恶意破坏仍然可能存在,全球每年因信息安全事故而蒙受巨大的经济损失,如何增强网络安全保障仍是一项挑战。本文有三个目的:(1)探究网络环境下人的鼠标操作行为模式(简称鼠标行为