婚恋系统智能推荐算法的研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:angieho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网中用户数据的爆炸式增长和机器学习在各个领域的迅速扩张,用于解决婚恋交友问题的相关智能推荐算法也日趋活跃。本文以研究婚恋系统中智能推荐算法为课题,重点研究了具有较高准确率、泛化能力以及鲁棒性的婚恋推荐算法和婚恋系统中用户冷启动问题的解决方案,并以网站的形式将算法研究与应用结合起来,为用户推荐一组候选人。主要工作分为三个部分:1.提出一个具有更高准确率、泛化能力以及鲁棒性的SPWB算法。SPWB算法是三种算法叠加(Stacking)起来的混合婚恋推荐算法,其中P表示基于流行度(Popularity)的婚恋推荐算法,W表示基于威尔逊区间(Wilson interval)的婚恋推荐算法,B表示基于贝叶斯(Bayesian)的婚恋推荐算法。本文用NDCG(Normalized Discounted Cumulative Gain)来评估推荐算法好坏,实验结果表明,SPWB算法的推荐能力相对单个算法的NDCG值平均提高了5.9%,其中相对基于流行度、威尔逊区间和贝叶斯的婚恋算法的NDCG值分别提高了6.3%、5.7%和5.8%。2.提出一种婚恋推荐系统中用户冷启动问题的解决方案。由于本文的SPWB算法是根据系统中用户的交互行为来分析用户择偶喜好,进而为用户推荐候选人。但是新用户没有交互行为,系统仍然需要为新用户推荐个性化的候选人。因此,本文提出KD-KNN-LR(Combination of KD-KNN and Logistic Regression)算法为新注册的用户推荐候选人,利用用户注册信息进行双向匹配,解决系统中用户冷启动问题。实验结果表明,根据测试用户的择偶标准,KD-KNN-LR算法的准确率为86%。3.将SPWB算法和KD-KNN-LR算法组合起来应用在婚恋系统中,并使用个人择偶条件进行过滤,为用户推荐个性化的候选人。系统可利用KD-KNNLR算法为新注册的用户推荐候选人。当用户与系统发生交互后,系统记录登录用户与候选人的交互记录,并把最受登录用户欢迎的候选人的重要信息抽取出来,形成用户个人热点择偶标准。然后用双方热点择偶标准去过滤由SPWB算法为其生成的候选人排序列表,最终得到满足双方择偶标准的个性化推荐列表。婚恋系统的推荐结果表明,推荐列表中越靠前的候选人越能满足登录用户的择偶偏好,能够达到智能化推荐候选人的目的。
其他文献
我国的“营改增”政策是2012年开始实施的,经过几轮试点,对产业结构调整的效应正在逐步显现,大部分行业展现出了向好势头。建筑业作为我国支柱产业之一,由于施工时间较长,资金周转速度较慢,增值税链条尚不完善等原因,对税改表现出了明显的“不适应”,税负不降反升,个别企业甚至出现了经营困难的情况,其中以中小型建筑企业问题最为突出。中小型建筑企业进入门槛较低,从业人数众多,公司资质参差不齐,随着市场日趋成熟
目的 探讨2型糖尿病患者颈动脉内-中膜厚度(IMT)增厚的危险因素,为临床预防提供参考。方法 选取甘肃省康复中心医院就诊的466例患者为研究对象,其中113例2型糖尿病,根据是否发生IMT增厚将2型糖尿病患者分为正常组、增厚组和斑块形成组,分析影响2型糖尿病患者IMT增厚的相关因素。结果 与正常组相比,增厚组患者的平均IMT、年龄、空腹血糖、C-反应蛋白、总胆固醇、低密度脂蛋白胆固醇、肌酐均显著偏
随着经济的发展和市场化进程的不断推进,高校面临的压力越来越大。过去,由于高校非营利的社会性质以及成本由政府分担的特性使得高校缺乏成本控制的动力。事实上,无论是对于高校还是整个社会来说,资源总量都是有限的,如果把有限的资源使用在无关紧要的事情上,那么就浪费了资源存在的真正价值。而高校要想提高自身的核心竞争力,就应该聚焦问题,加强成本控制,合理利用资源。唯有如此,才能促进高校的进步与发展,实现资源的合
随着我国经济的发展和公积金制度的不断完善,人们使用公积金贷款购房的需求日益增加,银行的相关信贷业务也发展迅速。公积金贷款事关重大民生问题,要保持其健康平稳发展,就必须正视制度运作过程中的潜在风险,并给出积极应对,其中重要的一环是能有效评估贷款客户的资质。因此,亟需建立高效准确的模型,对客户的贷款逾期风险进行预测,并为银行的信用评估提供参考,实现风险规避。本文主要以山东省某银行的真实脱敏数据为例,建
伴随着国内高速、高铁等基础设施的快速铺设,一方面加速了经济的发展,另一方面也因建设活动影响到沿途的产业而产生利益纠纷,相关的专业养殖户因环境纠纷,尤其是由噪音引发的纠纷逐年走高。此类案件中,噪音污染纠纷因污染源和污染范围难以确定不易协调,在损失赔偿方面,生物资产评估也是一大难点,在现实中已发生多起该类由于公路上产生的噪音对养殖场产生不利影响,对养殖场来说在遇到环境纠纷后,缺少相关纠纷评估的系统方案
聚类算法对大规模无标签数据的分类能力使得它在数据挖掘领域占据了重要地位。其发展至今已有众多分支,例如划分聚类、密度聚类、谱聚类等。本文主要研究密度聚类的以下两个问题。第一个问题,继承于DBSCAN的传统密度聚类算法都有一个共性,即通过设置一个单一的全局密度阈值来识别稀疏区域和稠密区域。这种策略从根本上决定了它们很难处理变密度数据聚类。新近的一些聚类算法在一定程度上能够处理变密度数据聚类问题,但是它
近年来,国内外企业因财务丑闻、环境污染和剥削劳工等问题导致效益下滑甚至破产的事例屡见不鲜,因此社会各界对企业的社会责任活动高度关注。企业的目标是实现价值增长,而现有文献对企业履行社会责任能否提升财务绩效的研究仍存在争议。同时,企业自身及外部投资者都十分关注企业的盈利质量情况,因此构建更加全面合理的盈利质量体系来衡量企业价值,寻找履行社会责任与企业价值关系的突破口,实现企业履行社会责任能够提升企业与
在求解时间相关的偏微分方程的高阶隐式方法、控制理论、结构动力学、量子色动力学(QCD)等科学计算领域中,都会遇到求解大型稀疏移位线性系统问题。在数值计算中,如何快速高效地求解线性系统已经成为研究的重要方向。目前,求解移位线性系统的主要方法为Krylov子空间方法,因为其具有存储量少、计算量小且可以利用Krylov子空间的移位不变性,一次性求解多个线性系统等优点,逐渐成为研究的热点方向。GMRES算
随着人口老龄化的加剧,与年龄相关的疾病如阿尔茨海默症、帕金森等疾病的相关问题慢慢引起了人们的关注与研究。通过研究大脑年龄,可以对与衰老相关的疾病做到尽早诊断和预防,因此是一项非常重要且具有意义的研究工作。目前大脑年龄的研究主要借助核磁共振图像(Magnetic Resonance Imaging,MRI)和脑电图(Electroencephalogram,EEG)来分析个体估计年龄与实际年龄的差异
随着物联网时代的到来,在智能家居、智慧工厂和无人车间等室内环境下,通过分布式传感器可用实现对设备的智能控制,极大丰富和便利了人们的生活。然而,如何保证室内大量分布式传感器长时、稳定的能量供应,是能否实现万物互联的关键。近年来,出现了一种腔体谐振无线输能技术,通过在谐振腔内激励出磁场,使接收器与磁场产生共振耦合来传输能量。相比于其他无线输能方式,该技术的能量传输距离远、传输范围大,同时还具有能量传输