基于语义和异构信息网络的专利引文推荐问题研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:wanshanshan1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在技术创新的时代,知识产权保护变得越来越重要,专利作为知识产权的主要形式,申请和授权的数量逐年增加。专利申请流程中,申请人和审查员需要引用与申请相关的现有专利,以确定该专利的新颖性。但是面对日益剧增的专利数量,申请人和审查员越来越难以有效、准确地找到合适的专利引文。专利引文推荐是克服这一困难不可或缺的解决方案,聚焦于自动地从专利数据库中搜索与目标专利相关的专利引文列表,进行推荐。专利数据的核心是文本内容,它描述了一篇专利的技术思想和所要保护的范围。因此,已有的专利引文推荐方法大多侧重于基于文本内容,例如,利用关键词搜索或者文本语义的获取进行推荐。近年来,异构信息网络因其对不同类型信息强大的建模能力,被广泛的应用到推荐系统中。一些学者,引入专利结构信息构建异构信息网络,进一步提高推荐效果。然而,现有的方法都是基于已有的结构以及关系去构建异构信息网络,这会忽略专利文本对象之间存在的潜在相似性,从而导致原本相似的专利在网络中距离却很远。本文将潜在的语义信息和现有的专利结构信息进行关联,更好的学习结构和语义信息。具体地,本文利用文本内容相似性和主题相似性获取专利的潜在语义关系,并将语义关系与专利结构信息进行有效的融合,然后使用网络表示学习的方法学习网络中结点的特征,以此来挖掘专利之间深层次的结构和语义信息,进而进行专利引文推荐。除此之外,本文还同时考虑固定层次结构的文本特点和异构的结构特点,进一步的提升专利引文推荐的效果。本文的主要工作如下:1)针对异构信息网络中蕴含潜在的语义关系,本文提出一种基于语义异构信息网络嵌入的专利引文推荐方法(SHINE)。首先,基于专利的主题和文本内容的联合相似性,得到专利之间潜在的语义关系(语义链接);其次,将语义链接和专利的结构信息融合到一个异构信息网络中,并利用Skip-Gram模型的网络表示学习方法将这两种信息映射到公共的向量空间中;最后,通过多模态相似度的线性组合计算专利之间的相似性,并返回相关引文的列表。在两个公开的专利数据集USPTO-A和USPTO-B进行了实验。与对比方法相比,本文提出的方法SHINE在平均精度(AP)、曲线下面积(AUC)和召回率三个评价指标取得了明显的优势。2)针对专利文本信息和结构信息的特点,本文提出一种基于层次语义异构信息网络嵌入的专利引文推荐(HSHINE-PCR)来进一步扩展SHINE。首先,根据专利文本固定层次结构的特点得到固定层次向量,进而获取语义链接;然后将语义关系和专利的结构信息融合在一起,构建异构信息网络。考虑到专利结构信息的异构性,采用异构SkipGram模型的网络表示学习方法将二者信息映射到同一低维空间中,同时获取网络中结点的向量表示;最后同样采用多模态相似度的线性组合进行专利引文推荐。在USPTOA和USPTO-B的基础上,增加了一个更大数量级的USPTO-C数据集,试验结果表明所提出的方法与对比方法以及1)中的方法相比,有较好的提升。
其他文献
赋是一种介于诗歌与散文之间,却又与诗歌、散文并称的文体。人们常将楚辞与汉赋相提并论,探究二者的相似之处。但事实上楚辞与汉赋之间存在明显的区别,主要区别就在于楚辞重言情,汉赋更重言事。汉大赋是汉赋叙事的主体,叙事性是造就汉大赋在汉赋乃至中国古代赋文中特殊历史地位的关键。从叙事角度重新审视汉大赋,不仅可以揭示大赋对先秦著作中叙事因子的承袭,也可揭示赋文体自身叙事的可能性与创造性。汉大赋叙事是中国古代叙
薛凤祚作为一名古代科学家,在能精于历算的同时也能够兼涉多家之长,这种卓越的个人能力对于研究者来说是非常值得重视的。而且明清之际正处于政局动荡时期,政治领域的变化随之引起了思想文化领域的改变,由此众多知识分子的思想也随之发生变化,再加上西方传教士等陆续来华,在这样复杂的大环境下,有深厚家学渊源的薛凤祚在相继接受了儒家思想和理学思想的熏陶后又学习了传统的天文历算,在受到致用之风的影响下又吸取了西方天文
《民法典》第1232条正式以法律的形式确立了环境领域适用惩罚性赔偿规则,但该规定因适用条件模糊、赔偿数额的确定方法缺失等问题而不具备可操作性,将来也会给司法机关适用该项制度带来不便。其中,赔偿数额的确定是决定该项制度功能能否实现至关重要的一环,数额设置过低会使制度丧失原有的惩罚、遏制作用,而数额设置过高又会造成惩罚过度。适当的赔偿数额不仅能弥补被侵权人的合理损失,更能达到震慑环境违法行为以及遏制潜
题壁诗,是指作者将自己的诗歌直接题写在竖直坚硬的墙壁上。唐代题壁诗内容丰盛,具有与众不同的魅力。白居易曾云:“明朝新壁上,谁得众人传”,其主观传播意识非常强烈,留下了数量可观的题壁诗。笔者据顾学颉《白居易集》和谢思炜《白居易诗集校注》统计,白居易有133首题壁诗。本文以此为研究对象,采用整理归纳、文本细读的方法,对白居易笔下题壁诗的主题内容、情感内涵、艺术特色等进行分析研究,全文共分为三章:绪论部
因徽州独特的地理形势,桥梁成为徽州交通设施中的重要组成部分,而明清时期是徽州桥梁的重要发展期,具体表现为桥梁数量的不断增加、石桥的广泛应用及桥梁规模的扩大。本文首先考察明清两代对桥梁兴修的制度规定,总体上并无太大的差异;其次对明清时期徽州桥梁数量与分布进行统计,并对桥梁与渡口的关系予以解释;再次分析官府、士商、僧侣、民众在桥梁修建中所发挥的作用,总体来说,明清时期徽州桥梁以民修为主,官府只在某些桥
二手书店,又俗称旧书店,不同于普通书店,主要以回收和销售旧书为主要业务。如今,世界经济依然相对萎靡,加上2020年的新冠疫情,中国国内的经济增速也在进一步放缓,使得实体业遭受一定的冲击。作为实体业和文化产业的重要组成部分,许多书店经营困难,纷纷停止营业,二手书店则更加难以幸免。相对于实体产业,近些年移动互联网技术的飞速发展使得线上交易服务逐渐兴起,其中也涉及二手书产业,比较知名和成功的线上平台如孔
近年来我国涉及网络深层链接的案件逐年攀升,深层链接行为的法律定性是我国长期未解决的法律难题,其中产生如用户感知标准、实质性替代标准等一系列的定性标准,这些争问题也依然困惑着我国司法实践,因此明确深层链接行为的法律性质,平衡各方主体的利益是亟待解决的问题。对作品的深层链接行为与作品的传播行为的极大相似性决定了解决此问题必须从信息网络传播行为的定义入手,从作品传播技术角度去分析信息网络传播行为的构成,
公平、自由的市场竞争环境是经营者开展有效竞争、实现市场对资源优化配置的前提和条件。但近年来,随着平台经济的迅速发展,电商平台实施独家交易行为屡见不鲜,电商平台的行为打破了自由竞争的市场环境,破坏了良好的市场经济秩序。从2017年京东诉天猫滥用市场支配地位案到2021年《关于平台经济领域的反垄断指南》的出台,我国规制平台垄断行为已经走过了4年的时光,电商平台垄断行为逐渐被国家重视,对电商平台独家交易
随着互联网的发展,网络著作权侵权案件愈演愈烈,信息存储空间服务提供者成为重要的被诉主体,信息存储空间服务提供者著作权侵权赔偿责任制度存在着诸多的争议。为了维护著作权人的权利、打击网络著作权侵权,保护网络服务提供者的合法权益、刺激互联网产业的发展积极性和创造性,需要对信息存储空间服务提供者著作权侵权赔偿责任制度进行研究,发现不足并提出相应的完善措施。信息存储空间服务提供者是指为网络用户提供作品的发布
2020年新型冠状病毒肺炎疫情袭来之际,“在云端”成为当时人们普遍的生活方式,与此同时,数字媒介发展突飞猛进,不断嵌入人们的日常生活并构成身体区隔下人类的“在世存有”。从线上办公平台到在线教育平台,钉钉在短短几个月的时间内成为全国1600多万专任教师、2.8亿学生开展云端课堂的重要媒介,实现火爆出圈。探究“出圈”行动的生发逻辑及其所牵涉的行动力量,是我们理解数字媒介嵌入日常生活的独特抓手。基于此本