论文部分内容阅读
近年来个性化推荐系统逐渐成为众多研究者们的研究焦点,给人们的生活和工作带来了很多便捷。但是随着网络求职招聘的信息量呈爆炸式增长,简单的职位搜索可能难以满足求职者的需求。尽管职位推荐技术越来越得到广泛的应用及普及,但是很多招聘网站并没有针对求职者的历史行为进行分析与发掘。本文对基于求职者行为分析的职位推荐系统的构建进行了深入的研究,针对基于传统的职位搜索与浏览的推荐现状在实际实施过程中面临的问题,提出了对求职者的Web行为日志分析的方法,运用基于内容的过滤、基于人口统计过滤与协同过滤推荐技术,设计与实现了一种基于行为分析的个性化职位推荐系统。本文主要研究内容和工作如下:(1)将基于内容的过滤、基于人口统计过滤与协同过滤推荐技术应用于个性化职位推荐系统中。通过对求职者的Web行为日志分析,将求职者行为分为注册、浏览与申请行为,构建求职者-职位模型,结合求职者的概要与求职意向等信息,采用线上实时收集求职者行为数据、离线数据分析与在线实时计算相结合的方式为求职者提供实时推荐服务。本文推荐服务分为求职者登录求职网站触发的职位推荐和求职者成功申请职位时触发的职位推荐,通过对系统的准确率和召回率约束以保障该推荐系统的开发质量。(2)采用基于内容的过滤和基于人口统计的协同过滤技术来实现求职者登录求职网站触发的职位推荐服务,利用各自技术的优缺点对推荐结果进行优化。根据求职者的求职意向与职位内容的匹配度对职位进行过滤,使用局部加权相似度法计算求职者-职位之间的相似度,构建求职者-职位层次结构模型确定局部相似度的权重系数,使得到的推荐职位更加具有可解释性。(3)采用协同过滤技术来实现求职者成功申请职位时触发的职位推荐服务。构建求职者-职位特征向量组合,包括求职者兴趣度、职位新鲜度和职位相似度,根据求职者申请的职位id和职位相似度的阈值对职位进行过滤,正负样本收集以及机器学习最优化权重,通过求职者-职位的逻辑回归分数为求职者提供推荐服务,使得到的推荐职位更加准确。(4)本文的数据存储、关键算法和求职者-职位模型是基于大数据平台Hadoop来实现,在线推荐服务是基于具有流计算能力的分布式平台Storm来实现,既可以支持海量数据的存储与计算,也可以提升在线推荐的响应速度,同时基于日志采集系统Flume和消息缓存系统Kafka实现数据的收集和传递,最终完成职位推荐系统。最后,本论文对提出的职位推荐系统进行了功能与性能的测评,验证了该系统具有实际应用价值。