基于MATLAB的就业数据的聚类分析

来源 :考试周刊 | 被引量 : 0次 | 上传用户:yangyinxia_email
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 根据2010年到2013年我院校大学生就业情况,对大学生的就业数据进行分析。数据分析有很多方法,本文主要采用谱系聚类、K均值聚类、模糊C均值聚类三种聚类方法,并得出了结论。
  关键词: MATLAB 聚类分析 就业数据
  随着中国高校教育的发展,大学生人数急剧增加,就业问题日益突出,大学生就业难的问题已成为社会热点、难点。根据2010年到2013年近四年我院校大学生就业情况,对大学生的就业数据进行聚类分析。根据就业数据可以对学生选择就读的专业及学校本科办学提供一定的参考价值。
  聚类分析是多元统计分析的一种,也是非监督模式识别的重要分支,在模式分类、图像处理和模糊规则处理等众多领域获得最广泛应用。它把一个没有类别标记的样本集按某种准则划分为若干个子集(类),使相似样本尽可能归为一类,而将不相似样本尽量划分到不同类中。
  收集和整理2010年到2013年这四年我院校的就业数据,对就业数据中的就业率、考研升学率和男女生首次平均月收入进行MATLAB编程,得出散点图,并进行分析。对就业数据中毕业生的就业流向分别采用谱系聚类、K均值聚类和模糊C均值聚类三种聚类分析方法进行分析。如表1。
  1.谱系聚类算法的步骤
  谱系聚类首先将每个样品看成一类,然后把最相似的样品聚为一小类,再将已聚类的小类按各类之间的相似性进行再聚类,随着相似度减弱,最后将一切子类都聚为一大类,从而得到一个按相似度大小聚集起来的谱系图[1]。
  利用谱系聚类算法对表1的就业流向数据进行聚类分析。将数据分成3类,从程序输出的结果得出结论,共可分成3类,常州单独为一类,南京、苏州、无锡为一类,剩下的镇江、扬州、南通之类的归为一类。也就是说,很多外地毕业生就在常州发展,很大一部分毕业生去南京、苏州、无锡工作,还有一小部分毕业生去了镇江、扬州、南通,还有省外等地。
  2.K均值聚类算法的步骤
  谱系聚类法是先将每一个样品看成一类,通过比较距离的大小逐步扩充类,因此,对于给定的数据,谱系聚类一定能将样品合并成为一类,分类结果唯一,但谱系聚类有一个缺点,就是样品一旦被分到某一类中就不能改变了,且当样品容量较大时,计算量相应变大。克服这一缺点的办法就是K均值聚类法,又称之为快速聚类法或动态聚类法。
  利用K均值聚类算法对表1的就业流向数据进行聚类分析。
  从图1可知,将地区分成3类。□为一类,分别表示常州、苏州、南京、无锡;一类,分别表示省外、镇江、扬州;○为一类,表示剩下的几个地区,如盐城、南通、泰州、宿迁等。换句话说,大部分毕业生选择在苏南地区工作,一部分毕业生选择去省外,如上海和镇江、扬州工作,只有少数一部分人选择去淮安、宿迁、盐城等地工作。
  3.模糊C均值聚类算法的步骤
  模糊聚类得到了样本属于各个类别的不确定性程度,表达了样本类属的中介性,即建立起了样本对类别的不确定性描述,能更客观地反映现实世界,从而成为聚类分析研究的主流[2]。
  采用模糊C均值聚类算法对表1的就业流向数据进行分析。从输出聚类的结果来看,常州、南京、苏州、无锡这四个城市为一类,表示很大一部分毕业生愿意在这几个城市发展;镇江、扬州、省外三地为一类,表示有一部分毕业生选择在这些地方发展;剩下的如南通、盐城、泰州等七个城市为一类,说明少部分人愿意去这些城市工作发展。
  4.三种聚类算法对就业流向的分析结论
  从三种聚类算法的结果可以看出,谱系聚类算法与K均值聚类算法和模糊C均值聚类两种算法的聚类结果不同。通过比较可以看出,谱系聚类算法的结论不是很理想。K均值聚类算法得出的散点图更直观地表现了数据的聚类,所以K均值聚类算法更好一些。
  通过对就业流向的聚类分析,可以看出极大一部分毕业生选择在江苏经济发达地区工作,如苏州、南京、无锡、常州这些城市,其中由于我院校在常州,因此很大一部分毕业生愿意留在这个生活了四年的地方工作。毕竟在大城市的选择和发展机会都比较多。还有一部分毕业生选择在镇江、扬州和省外如上海等地工作。只有少数一部分人愿意去如泰州、盐城、宿迁等地工作。
  参考文献:
  [1]吴志远,王远干.大学生身体数据的FCM算法聚类及MATLAB实现[J].科技通报,2013.
  [2]周红进,王秀森.基于MATLAB的海量数据处理方法[J].计算机与数字工程,2012.
其他文献
羊中王是陕西榆林羊毛防寒服集群中发展历史久、产品销量好、品牌知名度高、消费者口碑优秀的龙头企业之一。除此之外,羊中王更有着“社会福利集团”的独特属性,对于产业集群甚至整个榆林来说,羊中王都是一个非常特别的存在。  羊中王多年来致力于建设一个现代化的集残疾人和下岗职工培训、安置残疾人最多,羊绒毛等产品收购初加工最广,服装生产种类最全,销售网络最健全的“四位一体”的横山县社会福利集团公司,位居陕西省民
传统哲学一般主张真理是观念与对象的符合,而詹姆斯打破了主客二分的传统思维,提出了自己关于实用主义的真理观,认为真理是多元的,应该把观念的真理性和有效性相结合,在实证
摘 要: 随着我国高等教育不断普及,大学生数量与日俱增,一方面彰显了我国高素质人才队伍的壮大,另一方面使大学生的就业形势变得愈发严峻。高校面对这种现状时,要发挥自身优势,加强对大学生创业就业的指导教育,加强大学生创业就业工作信息化建设,不断提升就业服务水平,加强自身就业工作队伍建设,提高指导能力,加强就业质量评价反馈机制建设,提升追踪反馈能力,建立健全大学生就业指导服务体系,实现大学生高质量就业。
税收作为实现国家宏观经济调控的主要手段,是市场经济条件下创造企业公平竞争的外部环境的重要因素之一.在社会主义市场经济条件下,企业与政府之间的分配关系主要通过税收来
随着社会的不断发展,信息化进程的不断加快,在医院财务管理中,资源管理系统得到了广泛应用,并且取得了良好的成效。资源管理系统作为一种信息管理工具,在医院财务管理中发挥
海绵城市又称为水弹性城市.现在经济发展迅速,社会也在不断地进步,这就带动了城市规划的发展,越来越多的人开始关注城市规划与建设.本文主要讲述的是一种新型的城市规划方法,
财务会计管理在我们国家的企业当中处于至关重要的位置,尤其是对那些工程企业来说,由于工程企业工作的开展涉及的面非常的广,一般资金在工程企业的流动性都非常大,若是不加强
摘 要: 为了能够令高校环境设计专业毕业生的就业率有所提升,则需对环境设计专业的人才通过市场所需打造培养的规划及目标。当前高校在环境设计专业应用型人才培养方面应当持续提高,以此对高校环境建设专业应用型人才的培养更加深入。  关键词: 地方高校 环境设计专业 应用型人才 培养方面  地方高校在我国占有一半比率,所以,地方高校专业教育能力的发展,显著影响我国高等教育的发展。通过社会市场分析地方高校人才
为了保证新闻信息有良好的准确性、真实性、可读性,应认识到新闻记者自身社会责任以及职业素养的重要性,并能结合实际的新闻报道工作需要,不断的强化自身社会责任感以及职业