基于数据仓库和语义分析的社会标签推荐技术研究

被引量 : 3次 | 上传用户:cheayu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术和电子商务的快速发展,网络里的数据量呈爆炸式增长,这导致了网络中出现严重的信息超载问题,用户需要付出相当大的代价才能从信息数据的海洋里检索到自己感兴趣的资源。为了降低这种代价,出现了基于社会标签的推荐技术。社会标签是用户在标注资源时自主选择的关键词或词语,社会标签不仅能够帮助用户更好地组织、管理自己感兴趣的资源信息,而且还可以根据用户使用的标签信息发现用户的兴趣偏好向用户推荐满足其兴趣偏好的资源。那么在此背景下,如何准确有效地向用户推荐标签,以及根据用户的标签记录信息发现用户的兴趣偏好并向其推荐资源就成为当前研究的重要方向。当前的主流标签推荐方法有很多,但是在推荐过程中对用户、资源和标签三元素之间的关联关系普遍考虑不足,而数据仓库提供的多维数据集正好可以很好地体现三元素之间的关联关系,所以本文研究如何将数据仓库技术应用到标签推荐中并准确高效的向用户推荐标签;但同时由于数据仓库中三元素间的语义关系不能得到很好的体现,所以本文还提出了基于加权元组潜在语义分析的社会标签推荐模型。以下是本文的主要工作:1.针对标签推荐过程中用户、资源和标签之间关联关系考虑不足的问题,给出了基于数据仓库技术的社会标签推荐模型。该模型中采用了数据仓库的多维数据集技术,构建标签的多维数据集,建立数据挖掘模型,利用它的底层多维数据模型、OLAP分析功能对数据进行处理分析,并使用数据仓库的Microsoft关联规则技术挖掘多维标签数据集中的规则实现社会标签推荐,从而通过使用数据仓库技术有效解决在推荐过程中对用户、资源和标签三者之间的关联关系考虑不足而导致推荐精确性不高的问题。2.针对使用数据仓库技术进行标签推荐时不能很好的体现出用户、资源和标签之间语义关系的问题,给出一种基于加权元组潜在语义分析的标签推荐模型。该模型引入社会网络的结构化分析方法对标签元组进行量化加权,以构建加权的三维张量结构模型,并对生成的三维张量结构模型进行高维奇异值分解,然后通过元组的潜在语义分析,得到能体现用户兴趣度的加权元组集,产生推荐结果集,从而解决因用户、资源和标签之间的语义关系考虑不足导致的推荐结果精确性和有效性低的问题。通过来自典型大众标注网站Delicious中的用户标注数据集,验证基于数据仓库技术的社会标签推荐模型和基于加权元组潜在语义分析的社会标签推荐模型,均能够取得较好的推荐效果。
其他文献
随着计算机视觉与人工智能技术的发展,语义技术减少了人与机器交互的隔阂,如何根据人类的高层语义建立一种人机交互系统生成非参数化图像是当前的技术挑战。本文研究目标是提出
改革开放以来,我国着力开展扶贫开发工作,扶贫事业取得了显著成效。看到成效的同时,也应意识到我国扶贫开发工作是一项艰巨而长久的历史任务。在扶贫开发工作推进过程中面临许多
目前,随着汽车工业的飞速发展,汽车保有量也随之高速增长,这使我国的环境和能源面临着严峻的挑战。能源与环境问题日益突出,制约着我国汽车工业可持续发展,发展电动汽车成为保障我
为解决止浆塞在注浆过程中需要将浆液注入到设计段的岩石裂隙或孔隙内,同时还需要与钻孔井壁形成密封防止钻孔返浆时,存在止浆塞工作不可靠的问题,针对目前我国深井水平裸孔
自动化生产加工中需要实现自动换刀,而什么时候应换刀以及刀具形状尺寸是否正确,需要通过在线监控刀具状态为依据。然而目前在机监控刀具状态尚依赖切削力、机床主轴电流/功率
汽车保有量迅速增长,引发洗车行业水资源消耗与废水排放问题,社会广泛关注。洗车水循环处理设备能节水减排是问题解决的有效途径。虽有系列法规制度对洗车水循环处理设备推广应
对某钢铁厂110kV线路跳闸,自备发电机解列停机引起的重大事故进行了原因分析。提出在事故发生后应合理安排运行方式,最大限度地降低事故损失;调整内部负荷分配,重要设备配置不间
儿童时期是每个人身心发展的关键时期,同伴关系在这一时期又具有不可替代的重要作用。而对于寄宿的农村小学生而言,提升其同伴交往能力,帮助其建立正面的同伴关系对于他们更
随着海洋开发以及海洋权益的争夺,包括军事防护工程在内的海洋工程建设日益增多,对于远离大陆的岛礁工程来说,所需的各项材料均从遥远的大陆运输,其运输成本非常昂贵。钢管珊瑚混
随着经济全球化的发展,世界各国经济联系日益紧密,海外交往越来越频繁,海洋的重要性日益突出,各国对海洋安全的重视程度不断增加。这导致了舰船市场需求的增加。本文首先从经济、