基于语义分析的知识社区资源推荐方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:forde88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识社区是互联网时代人们进行资源获取和学习的重要场所。它以其开放性、快捷性吸引着越来越多人们的关注,对于很多科研学者,知识社区甚至成为他们与外界交流与沟通的主要方式。随着知识社区用户间的交流,知识社区中的资源呈几何数级增长,人们在学习的过程中,要想从这些大量的资源中找到自己感兴趣的资源变得越来越困难,于是资源推荐便成为学者们研究的重点。目前大多数推荐方法仅从简单字面匹配或者词频角度给予用户推荐,没有充分考虑到资源内部的语义信息,而语义分析方法可以充分挖掘资源中潜在的信息,从而充分反映资源所要表达的内容和含义。因此,如何结合资源的语义信息给予用户推荐是知识社区资源共享研究应该考虑的问题之一。为此,本文尝试采用LDA主题模型和用户分类本体两种语义分析方法分别给出两种知识社区的资源推荐方法,以期从不同角度提高资源推荐结果的评估指标。文章的主要内容分为以下两个部分:第一部分,基于本体与LDA主题模型的知识社区文本资源推荐方法研究。LDA主题模型将文本资源表示为某种概率的主题分布以及相应主题的词分布,因此,与基于TF-IDF词频统计的推荐相比,基于LDA主题模型的推荐可以获取文本资源内的语义信息,有效地解决一词多义、异形同义等问题。但由于该模型假设主题之间是相互独立、互不影响的,这就使得推荐的结果总是局限在同一主题的范围内,进而限制了推荐的惊喜度。所以本文将本体引入到基于LDA主题模型的文本资源推荐中,通过本体扩展LDA模型的主题得到关联主题,然后考虑关联主题在文本中的分布概率,结合加权后的关联主题给予用户最终的推荐。最后在CiteULike网站提供的数据集上进行实验验证,实验结果表明,引入本体后,基于LDA主题模型的推荐惊喜度有了明显的提高。第二部分,基于用户分类本体的协同过滤知识社区视频资源推荐方法研究。目前使用最广泛的个性化推荐方法就是协同过滤方法,该方法中最重要的一步就是相似性计算,但是随着用户数目剧增就造成在相似性计算过程中算法的执行效率过低的问题。为了解决该问题,本文提出一种基于用户分类本体的协同过滤推荐方法。该方法首先构建用户分类本体,然后根据本体中概念间的语义关系获取分类规则,利用分类规则对庞大的用户群进行分类。在保证一定的推荐准确度前提下,为用户寻找局部近邻用户,并以局部近邻用户为基准完成资源推荐。最后在MovieLens公开数据集上进行实验验证,并且分别通过F1与平均绝对误差两个指标进行用户分类与推荐精度评估,在用户分类准确及推荐精度良好的前提下,用时间复杂度衡量算法效率。实验结果表明,引入用户分类本体的协同过滤推荐减少了近邻用户识别的计算量,同时提高了算法效率。
其他文献
无论在当前还是未来,位置信息对一些网络应用都是至关重要的。协作定位作为一种新的定位算法,为无线定位提供了广阔的前景。与传统定位所不同的是,在定位过程中协作定位算法
铝合金作为轻质合金的代表,被广泛应用于汽车、航空航天、船舶等诸多领域。车用铝合金大多是压铸成型,且不易维修等原因,一旦损伤很难再进行继续使用。作为一种新型制造技术,3D打印技术不只在制造领域有十分重要的地位,在零件修复领域也有其用武之地。目前,对3D打印技术的研究已有很多,尤其在金属3D打印工艺上的研究已经十分深入。但在3D打印修复领域,特别是金属零件修复过程的研究却不是很多。主要是因为3D打印修
伴随着移动互联网技术的蓬勃发展,人们对网络吞吐量、接入能力和高速率通信的需求也日益增加。传统通信技术无法满足未来通信的巨大需求,大规模MIMO(Multi-Input Multi-Outpu
差分混沌移位键控(Differential Chaos Shift Keying,DCSK)调制方案采用传输-参考(Transmitted-Reference,T-R)方式,通过参考信号和信息信号的相同或相反表示二进制数据比特,
随着多播应用的逐渐普及,多方会议、视频分享和高清电视等等的多播应用变得越来越流行。互联网中的业务量急剧增加,对通信网络的容量和吞吐量要求也越来越高。许多有关网状WD
时延容忍网络(Delay Tolerant Networks,DTN)具有节点能量与存储能力受限、链路时延长和链路间断连通等特点,网络中不存在持续连通的端到端路径,因此传统地面连通网络中的TCP
液滴分析技术是指在液滴的生长过程中,利用光纤电容液滴传感器获取通过液体的光强和液滴体积的变化曲线,进而获得可以反映被测液体综合特性的“液滴指纹图”。通过对液滴指纹
基于Wiki的开放式协作内容生产方式和开放式协作社区在新一代网络中日益盛行,开放式协作内容不仅在社会化媒体受到欢迎,更引起学术研究领域的极大关注。Wikipedia是最著名的W
随着云计算技术的快速发展和云服务的广泛应用,企业和个人可以通过低廉的成本按需获取云服务厂商提供的高质量云服务,而无需购买和部署高昂的硬件设备。然而各大云服务提供商
超级电容器是一种建立在界面双电层基础上的新型电化学储能电子元件,相比于传统的电容器与蓄电池,它表现出了更高的功率密度、更长的循环寿命,而且具有容量大、环境污染小、成本低等优点。2004年,石墨烯首次被发现,因其具有比表面积高以及导电性能优异等特点,被广泛应用于各种纳米材料的载体,也是理想的储能器件候选电极材料。因此本论文以石墨烯作为载体,通过对其表面功能化,负载过渡金属化合物在其表面,并与优选的基