基于客源挖掘的个性化推荐系统

来源 :武汉大学 | 被引量 : 1次 | 上传用户:woshigr321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐合适的住房给客户是房产领域中一个重要的课题,现今房产领域的研究主要集中在预防房产泡沫和房产信息检索上,鲜有针对该领域客户的推荐研究。由于购房客户行为具有决定周期长、低频等特点,Item-based和User-based的推荐算法在精确率和召回率上表现双低,无法构造一个有效的推荐系统。本文针对当前客户的特点,定义适合当前推荐的目标问题,使用泛化标签和迁移学习两种方式拓展样本,并将ID类属性使用Embedding方式泛化为向量,在使用FM时,提出了度量特征在FM对分类问题贡献度的指标,可在FM中用于特征选择。本文主要内容如下:(1)标签泛化和迁移学习样本拓展。此次推荐将目标定义为分类问题,该分类问题中正样本易于构建,而负样本能达到正样本的十倍以上,本文将负样本分类后按比例下采样,并泛化正样本标签来扩展正样本和抵消时序特征的影响。针对正样本不足的情况,使用迁移学习的方式,引入更多的样本,使模型能够学习更一般的特征。实验证明,使用标签泛化和迁移学习扩充样本后,模型AUC有提升。(2)ID类属性Embedding。客户ID类属性和楼盘ID类属性不能直接输入模型,本文将根据用户的行为数据,通过行为加权和时间衰减加权的方式,为客户构建楼盘的评分。并基于客户的评分矩阵,在Spark中使用ALS算法分解出客户向量表示和楼盘向量表示,使用得出的向量,来作为ID类属性的Embedding表达方式,并在Movielens数据集上验证Embedding后向量用于分类的效果。实验表明,Embedding后的属性特征在分类中能取得不错的效果。(3)提出了 FM模型特征重要度的评判指标。在线性模型中,可直接使用一阶向量的权重来进行特征上的选择,然而FM模型中涉及到二阶交叉特征,不能直接通过权重来评估特征的重要性。本文将提出一个在FM模型中评估特征对于分类贡献度的指标,该指标可以应用于FM特征选择。实验证明,该指标能够在FM模型中有效反应数据中不同特征对于当前分类的贡献。
其他文献
详细阐述了对铝板幕墙的面板设计过程,主要包括:面板材料的选用、面板的结构形式、面板的计算、面板的表面处理。经过工程实际应用,证明该设计是可靠、实用的,并且能对今后类似的
在当今社会,政府诚信是社会诚信体系不可或缺的一部分,没有政府的诚信就不会有社会的诚信,提升政府公信力必须要建立在阳光政府、法治政府、服务型政府等新理念前提下。本文
针对文献[1]在R上引进的一类恒等逼近,研究了它在R上对应物的性质,并且对一类重要的特例(本文称为p型恒等逼近)进行了分析.
从麦胚水溶性提取物中分离得到粗蛋白-糖复合物,经DEAE-Cellulose和Sephadex G100柱层析,得到均一的麦胚水溶性糖蛋白(WGWSGP).Sepharose CL-6B凝胶过滤纯度检验表明WGWSGP是
应用型本科高校面临着转型发展,培养应用型人才来适应社会、服务社会。建设一支高质量、高水平的“双师双能型”教师队伍是应用型本科高校的重要职责。文章就当前应用型本科
三嗪成炭剂(CNCH-DA)与多聚磷酸铵(APP)复配成膨胀型阻燃剂(IFR)应用于EVA的阻燃改性,采用氧指数测定仪(LOI)、垂直燃烧测定仪(UL-94)分析了EVA/IFR复合材料的阻燃性能,采用
以“中杂105”番茄为试验材料,在日光温室基质栽培条件下研究了CO2增施浓度和养分水平对番茄生长的影响。试验设置4个CO2水平,分别为不增施(C0)、(700±50)μmol/mol(C1)、(1
目的:探讨腹部手术患者最佳的吸氧方法。方法:选择全麻腹部术后胃肠减压患者60例,分为3组,分别采取与胃管同侧鼻孔鼻导管吸氧法、胃管对侧鼻孔鼻导管吸氧法、面罩吸氧法给患
<正>全国文化信息资源共享工程(以下简称文化共享工程)是由文化部、财政部2002年起共同组织实施的国家重大建设工程。它利用现代信息技术,将中华优秀文化资源进行数字化加工