基于词向量的标签语义推荐算法研究

被引量 : 7次 | 上传用户:eg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Web2.0的环境下,鼓励用户创造内容是主基调。社会化标签作为一种使用灵活、对用户友好、无约束的分类方式,在业界得到了广泛的应用。社会标签具备组织、分享、检索和发现新资源、新用户等良好特性。但同样也存在标签分布稀疏、标签使用率低、用户标注随意以致出现噪声标签甚至恶意标签等情况。为趋利避害,标签推荐技术应运而生,得到学界的广泛关注,也成为推荐系统的热门研究方向。本文围绕社会标签系统的标签推荐技术展开。具体工作如下:第一、本文首先对推荐系统的组成以及推荐原理进行介绍,并对目前标签推荐技术的文献进行梳理,对算法分类整理并总结优缺点,为后续在标签推荐技术领域的研究提供一定的参考。本文发现目前大多数的标签推荐技术缺乏对标签语义的研究,而且现有的标签语义研究适用范围有限。因此提出基于词向量的标签语义推荐算法,以开发出兼具内容过滤和协同过滤优越性的标签推荐技术。第二、本文采用了Skip-gram算法计算标签相似度。与目前主流的Wu & Palmer概念相似度算法相比,具备三个优点:一是适用范围更广,Wu & Palmer概念相似度算法仅局限于英文;二是词语对象完备,Wu & Palmer概念相似度算法是建立在WordNet语义层次结构上,然而WordNet语义字典只收录155287个词语,无法对超出字典的词语进行处理;三是能计算短语的相似度。WordNet字典无法解析短语,如"less than 300 ratings",标签系统中类似的短语标签是很常见的。总而言之,Skip-gram算法在标签推荐领域实用性更强。第三、本文提出的基于词向量的标签语义推荐算法,结合了神经网络语言模型和匈牙利算法,较好地解决了标签与标签相似度和用户与用户之间相似度计算问题。并通过实验,与现有算法比较,在推荐精度上有一定的提高。
其他文献
目的:本研究旨在从补骨脂药材中分离出单体化合物,从中筛选出具有抗氧化活性和抗肿瘤活性的化合物;阐明补骨脂水提物在大鼠血浆中的主要入血成分和补骨脂乙素在大鼠体内的药
平安是人民幸福安康的基本要求,是改革发展的基本前提,是和谐稳定的综合体现,是中国现代化建设的重要保证。平安包括人民群众出行的平安,民用机场作为人民群众航空出行的必经
综述了枣树的器官培养、愈伤组织培养、花药培养、胚与胚乳培养、原生质体培养以及影响枣树组织培养的其他因素。营养器官培养报道的最多,其他外植体的培养相对较少,研究尚处
随着健美操的逐渐普及和发展,健美操赛事每年都在全国各地开展。此种情况下,对我国的健美操赛事安全保障进行研究,不仅有助于丰富有关健美操赛事安全的研究成果,而且有助于完
目的探讨血清人附睾蛋白4(HE4)及卵巢癌风险预测模型(ROMA)诊断卵巢癌的最佳切割值。方法检测该院64例卵巢癌患者和47例卵巢良性肿瘤患者的糖类抗原125(CA125)和HE4水平,并计
目的:提高地衣芽孢杆菌原生质体的产量和形成率,为进一步提高原生质体转化率打下基础。方法:通过酶解法对地衣芽孢杆菌工业生产菌株Bacillus licheniformis303原生质体的制备
以谷氨酸棒杆菌(Corynebacterium glutamicum)CLW0506(TRARDCPRAMTRhistidine-shikimic acid-)为出发菌株,利用亚硝基胍(NTG)诱变选育得到缺失腺嘌呤脱氨酶、肌苷酸合成酶、
近年来,随着旅游业的发展,我国的非物质文化遗产旅游开发得到了较快发展,特别是多种开发模式的运用,对非物质文化遗产的保护和传承起到积极功效。但目前对于何种非物质文化遗产适
目的:研究了在不同阶段、不同的底物流加方式及底物浓度对菌体生长和热凝胶合成的影响,并对粪产碱杆菌WX-C12(Alcaligenes faecalis)发酵生产热凝胶的补料工艺进行了优化。方
新经济时代,企业面临着更为激烈的全球化竞争、复杂多变的内外部环境和日益加快的技术革新,企业为了生存和发展必须不断革新企业制度、再造工作流程和创新生产研发技术,显然