基于多层特征表征与级联模型的医疗简历筛选

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:anlanyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究医疗简历筛选,提出了基于多级特征表征与级联模型的方法.首先,面向医疗简历教育与工作背景、科研能力、业务能力等多组与多层特征表征问题,提出基于注意力网络的多级特征表征方法,实现特征级、特征组级与特征组组合等多级表征的融合.其次,提出了级联分类模型建模细粒度筛选过程,将现有简单的“通过与不通过”粗略筛选改进为“优秀、良好、中等、一般”的细粒度筛选,更加符合现今医院招聘初审、笔试、面试的多级筛选过程,有利于后续对不同等级人才的考量,也解决了数据不平衡带来的分类错误.最后,在包含13552条简历的数据集上验证了所提出方法,以支持向量机为分类方法的级联模型平均F1值达82.46%.特别是能够提升优秀类简历的分类效果,对可能被录用的竞聘者识别的更好,对于简历筛选的实际应用帮助更大.
其他文献
针对传统的过采样算法中决策边界模糊以及噪声样本分布问题,本文提出一种基于概率密度函数与自适应过采样算法.首先将少数类样本分为安全样本、边界样本、噪声样本;然后采用瑞利分布(Rayleigh Distribution),对安全样本及边界样本进行采样操作,利用其概率密度函数对新样本的分布密度进行构造,以此达到平衡数据集的目的 ;最后使用随机森林作为分类器,并进行网格搜索(Gridsearch)进行参数寻优.实验结果将所提出的方法与4种代表性算法在10个不均衡数据集上进行了比较,验证了该算法的有效性.
随着互联网的发展,全球数据量爆炸式增长,信息过载现象严重,如何获取用户真正关注的信息成为困扰人们的难题之一.在此背景下,推荐算法在各个领域得到了广泛应用.本文首先介绍了目前主流推荐算法的分类方法和主要评价指标.其次,分别介绍了当前各类推荐算法的研究进展,其中包括传统推荐算法的基础推荐原理和研究进展以及神经网络在推荐算法中的研究应用,对其进行归纳总结.同时分析了数据稀疏性、冷启动和可伸缩性等推荐算法常见问题.最后,提出了现有推荐算法的不足以及在应用中遇到的部分问题,介绍了未来推荐算法的研究热点.
哈希检索具有存储消耗低、查询速度快等优点,被广泛应用于跨模态检索研究,其中基于深度学习的跨模态哈希方法是热点研究问题.大多数深度哈希方法通常在多模态数据的特征关联性学习过程中忽略了数据内容的潜在相关性和语义判别性,从而导致哈希码的关联性不强,容易造成原始数据特征和神经网络特征的不兼容问题.针对以上问题,本文提出一种图像-文本深度联合语义哈希算法(Deep Joint-Semantic Hashing,DJSH).该方法使用两个神经网络分别提取图像和文本的细粒度特征,并为每个模态网络设计了哈希层和标签层,分
生成对抗网络(Generative Adversarial Nets)是一种融合了生成学习和对抗学习的无监督学习方法,以零和博弈作为核心思想,其组件通过互相对抗不断地提升模型效果.将GAN模型融入到推荐领域中,可有效缓解数据稀疏性问题,提高推荐效果.本文从模型输入的是隐式反馈信息或显式反馈信息两个方面对基于GAN的个性化推荐模型进行了分析;探讨了基于GAN的个性化推荐研究已取得的相关成果,指出了现有GAN推荐研究在稳定性较差、缺少通用优化方法、模型复杂度较高、缺少通用评测指标等方面的不足;并从提高模型稳定
各种类型的深度神经网络模型已被应用到时序分析中,但基于频域的神经网络与时域的线性模型融合仍然缺乏有效的模型.提出一种基于多级小波分解的深度网络和差分自回归移动平均模型相融合的方法(mWDLNet),时序信号经小波分解到频域,由卷积神经网络和长短期记忆网络提取时序信号的空间和时间维度特征,同时利用差分自回归移动平均模型(ARI-MA)解决神经网络模型的尺度不敏感问题,最后融合两部分的输出结果,提高了预测的准确性.并通过实验验证了mWDLNet模型添加小波分解、卷积模块以及融合线性预测的有效性.将提出的模型应
传统的兴趣点推荐通常忽略了用户签到行为中序列模式的重要性,且无法有效地捕捉用户复杂且动态变化的兴趣偏好.由此,本文提出了一种用户偏好和时间序列的兴趣点推荐模型(User Preference&Time Sequence based POI Recommenda-tion,UPTS-PRec).该模型能够分别对短期偏好和长期偏好建模并融合,以捕捉用户兴趣的变化.对于短期偏好,提出了融合时空上下文信息的长短期记忆网络来学习用户签到行为中复杂的序列转移模式,并通过基于目标的注意力机制进一步精确地提取短期偏好.对
随着互联网上用户移动数据的日益繁荣,用户的移动行为预测也成为了预测研究的热点.近年来,循环神经网络(RNN)技术因其高效性和扩展性在移动预测中得到了广泛的应用.但是,目前大部分网上收集到的用户移动行为数据普遍具有稀疏和异质的特性,特别是当用户出于习惯或隐私考虑可能会拒绝向平台提交活动记录.因此在这些稀疏数据集上基于RNN的预测技术无法有效地学习到足够的用户行为特征,从而影响了模型的预测性能.为了解决该问题,本文提出了一种融合信息网络结构的数据增强行为预测算法.具体来说,首先我们将用户历史行为数据转为信息网
在人机交互动作识别领域中,基于深度学习的动作识别方法比传统的手工特征提取方法准确率更高.为了解决基于深度学习的动作识别方法在实时人机交互的实际应用问题,本文设计并创建了交互动作数据集(IA RGB-D),用于深度学习方法的人体动作识别研究.将IA RGB-D用于多种神经网络的训练和测试,测试结果准确率均在95%以上,验证了数据集的正确性和有效性.为保障对采集动作的实时识别正确率,本文提出了一种基于高效通道注意力的位移图神经网络(ASGFCN),将高效通道注意力模块引入位移图卷积神经网络(Shift-GCN
针对现代大型系统中系统日志的异常检测问题,提出了一种基于自动日志分析的异常检测方法(CSCM).该方法通过在预聚类下结合细化分析与多视角的异常提取过程,来实现系统日志的异常检测.首先,引入信息熵以提取日志信息量;其次,基于Canopy预聚类过程提取子集交叠数据,以缩小计算范围;利用谱聚类进行细化分析,并结合预聚类结果以优化初始化问题;最后,通过关联不同视角下的日志分析,分别提出显性与隐性异常对象的定义,基于稀疏簇质心的分析和异常度的计算,识别出异常日志.实验结果表明,提出的检测方法能够准确有效地识别系统日
应急响应是各类突发事件应急管理的关键.为解决现有医疗领域应急响应决策支持模式存在的精细化程度低、决策服务单一、智能性不足等问题,提出了混合基于案例推理和规则推理的医疗紧急呼救事件应急响应方法.该方法首先将呼救信息构建为呼救知识图谱并将医疗单位和警务单位等信息构建为外部知识图谱集;然后通过实体对齐技术,将呼救知识图谱和外部知识图谱集融合成医疗突发事件知识图谱,以支持事件信息可视化和应急响应方案推理;最后运用基于案例推理(CBR)和基于规则推理(RBR)的混合推理方法,对突发事件知识图谱中隐含关系进行挖掘,推