论文部分内容阅读
进入21世纪,人才竞争成为衡量国家综合实力的重要标准,上至国家下至企业对人才测评越来越重视。人才测评理论的不断完善和信息技术的迅速发展,也使得各种人才测评系统不断涌现,这些系统大多运用于企业单位的人才测评或者教育测评,但是鲜有专门针对我国行政事业单位的人才测评系统。目前在我国,除了国家大型公务员考试,其它面向行政事业单位的人才测评则主要由各省市的人才测评机构进行组织,它们大多仍采用手工操作的方法,测评成本过高,测评效率较低,测评质量也难以保证。为了帮助这些人才测评机构为我国的行政事业单位提供更优质的人才测评服务,我们研究并实现了具有试题复杂性特征的人才测评系统。本文以某省的人才测评机构为具体用户,由于该用户负责的是除了国家考试以外的各行各业的行政事业单位的人才招聘考试,因此本文所研究的系统所使用的试题具有独特的复杂性特征,具体表现为试题所覆盖的领域知识广泛、题型多样、结构复杂、内容丰富等方面。本文围绕试题所具有的复杂性特征,结合人才测评机构的实际需求,重点探究了合理可行的试题管理方案,提出了基于改进的Simhash的试题相似性检测算法,设计了基于局部优化的遗传算法的智能组卷策略与灵活的手工组卷流程,实现了人才测评机构的测评工作流程的信息化管理。本文的主要贡献在于,一是针对试题的复杂性特征对试题内容采用半结构化的组织方式进行存储与管理,并基于考生成绩设计了试题难度与区分度的动态更新机制;二是通过对在短文本上表现不佳的Simhash算法就关键词过滤、权重赋值以及hash方法选取这三个关键点进行改进,提出利用基于信息熵的关键词过滤方法得到试题题干的特征向量,并对特征向量权重置1,选用Cityhash方法对加权后的特征向量进行哈希的Simhash改进算法,该算法在中文试题相似性检测上可以获得较高的准确率和良好的召回率,并在此基础上提出EW1CS-SimDetec算法运用于人才测评系统;三是所实现的系统涵盖了至少教育部规定的12大学科门类以及110个二级科目下的试题,并基于这些试题完成智能组卷和手工组卷功能。