基于科学-技术引用与文本关联的创新主题识别研究

来源 :北京协和医学院 | 被引量 : 0次 | 上传用户:sunvoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
创新主题是在一定时间内在科学和技术领域间具有交叉融合、互相转化、协同发展趋势的研究主题。创新主题的识别可以帮助科研人员把握最新科技动向,合理安排研究计划,为监管部门开展创新评价提供参考。在竞争激烈的商业环境中,尽早发现这些创新科技未来的变化趋势,对于政府和企业在制定研发战略规划合理安排产业布局等多个方面都是至关重要的。而如何科学有效地探测创新主题是创新研究中的亟待解决的关键问题。本研究建立了一套基于科学-技术引用与文本关联的创新主题识别的方法体系。首先,计算科学-技术之间的关联度。根据医学领域的文献资源特点,使用Lens平台和MTI文本标引工具,分别得到论文-专利间的引用情况和文献间文本相似度大小,由此构建了4个关联网络——引用关联网络、文本关联网络、引用关联与文本关联网络并集和引用关联与文本关联网络交集。并通过宏观指标和微观指标对关联网络进行评价,挑选出的最适宜构建计算科学-技术关联的方法为引用关联与文本关联网络并集。然后,识别科学-技术交互地带创新主题。以“布鲁顿氏酪氨酸激酶抑制剂”领域研究为例,通过社会网络分析,将该领域的论文划分为五类,对各子类的网络进行主题分析,首先通过词频统计和共词分析,得到各类别文献的高频主题词和高频主题词对。又通过训练LDA模型,对各类别文献的摘要进行自然语言处理和主题识别,得到能够描述文献主题的高频自由词。结合主题词和自由词对五个类目进行命名,类目名称分别是:细胞生物学、基因组学等基础研究,疾病白血病相关研究,药学实验研究,药物依鲁替尼(Ibrutinib)相关研究和疾病淋巴瘤相关研究。后对各类目中的高分文献进行定性分析,最终得到布鲁顿氏酪氨酸激酶抑制剂领域的创新主题和主题类目中具有创新潜力的文献。最后,结合该领域相关文献综述对所获得的创新主题和主题类目中具有创新潜力的文献进行分析、验证。研究结果基本符合文献综述的描述和专家认知,证明本研究中所采用的方法有效可行,达到预期。
其他文献
随着互联网与移动互联网的高速发展,网络中的数据呈爆发式增长,如何在缩小数据规模的情况下保留数据中的信息量变得尤为重要。为了更好地提取大量文本中的信息,自然语言处理领域提出了自动文本摘要生成任务。自动文本摘要通过计算机自动化地提取文本主要内容并进行压缩,从而帮助人们快速获取知识。的方法主要分为抽取式方法和生成式方法两种。抽取式摘要可以较为准确地提取原文中的要点,但是摘要句子的排序以及连贯性差是其存在
证券市场禁入是以限制相对人营业权为内容的行政处罚措施。2020年正式施行的《证券法》再次强化了市场禁入的法律效果,与之不相称的是市场禁入的适用条件仍然保持了原来概括式的规定。在适用条件的现状上,市场禁入制度包含三种禁入后果,证监会不加区分地并用违反了过罚相当的原则,单一的严重性标准一方面不合理地提高了市场禁入的门槛,另一方面使采取市场禁入丧失正当性基础。因此,为了保护相对人的经营权、约束证监会裁量
目的探索专业化心理护理培训在新入职护士规范化培训中的应用效果,为新入职护士规范化培训中薄弱环节提供新思路、新途径,为护理管理者如何实施高效的护士规范化培训提供实证参考。方法采取非随机整群抽样的方法,选取2017年和2018年辽宁省锦州市某综合性三甲医院的新入职护士作为研究对象,对照组为2017年新入职护士80人,采用常规的新入职护士规范化培训,试验组为2018年新入职护士80人,采用在常规的新入职
随着信息时代的发展,使得传统行业面临了前所未有的挑战和冲击。作为我国国民经济的支柱产业,建筑业近年来的发展规模依然不断扩大,随着国家不断推进城镇化建设和“一带一路”政策等的深化,其在未来很长一段时间内依然会是我国经济的支柱产业。但在近年以来建筑业增速放缓,亟需通过建筑信息化来注入活力。广联达作为国内领先的建筑软件信息服务商,在2015年面对外部经济下行的压力下,开始由销售软件向提供服务的SaaS商
经济转型升级过程中,出现一批低收入乃至贫困群体。为保障群众的基本生活需求,国务院发布了《城市居民最低生活保障条例》(简称低保制度)。低保制度的推进,在一定程度上解决了贫困群体的基本生存问题。该群体在享受低保政策的同时,也受到来自方方面面的诸多排斥。排斥具体体现在哪些方面,低保群体又是如何应对这些排斥,是本文要研究的问题。基于社会排斥理论和社会认同理论,本研究利用观察法和访谈法,以H市D社区的九名低
政务数据开放共享已经成为时代发展的必然趋势,在政务数据开放共享的过程中,数据的质量问题是影响数据价值的关键因素之一。如何对政务数据进行客观准确的质量评估与提升已经成为当前的研究热点。目前为止,众多学者已经在数据质量评估和提升两个方面取得了累累硕果,然而,已有的模型和算法仍然存在一些问题,例如:利用层次分析法计算权重太过于依赖人为的主观判定、而熵值系数法却完全基于客观数据确定权重、传统的向量空间模型
随着汉语学习者逐年增加,政府、高校和各教学机构为适应需求,采取了多项措施,但依旧面临师资紧缺的问题。与此同时,还存在大量无法进入传统意义课堂的汉语学习者。远程交互式对外汉语教学模式作为一种新兴教学方式,能够以较少的教学资源满足更多汉语学习者的需求,具有传统线下教学课堂所不具备的诸多有点,受到众多研究者的重视。远程交互式教学模式下的对外汉语教学,教学方式多样,考评系统良好,不受时间和空间限制,能够充
刺槐(Robinia pseudoacacia L.)具有良好的生态和经济价值,是荒山造林和水土保持先锋树种,而且还具有观赏、材用、蜜源和饲用等价值。与二倍体刺槐相比,四倍体刺槐品种在叶片产量、营养物质含量、遗传适应性和抗逆性方面优于二倍体,而且变异范围较大,具有很大的良种选育潜力。本研究以四倍体刺槐为材料(二倍体刺槐作为对照),在组培和盆栽两种生长环境下对比了不同无性系植株的生长特性差异,从形态
随着我国综合国力的提升和人民生活水平的提高,人们在满足温饱的基础上,越来越重视食品的质量和安全,蔬菜作为日常饮食中重要组成之一,其农药残留直接影响着环境、食品安全、消费者健康,由农药施用不当所带来的负面影响已经成为了一个严重的社会问题,并逐渐成为全社会关注的焦点,需要进行深入研究,并采取有力、有效的措施加以应对。本文采用文献研究、实地调研、比对研究、问卷调查、统计分析等方法,研究分析了通化市集安地
如今,社区在城市管理中起着越来越重要的作用,特别是在十九大以来,社会治理重心向基层下移,各项服务职能逐步向社区下沉,构建城乡社区治理新格局等一系列改革举措使社区工作者的工作任务不断增加,工作要求越来越高,他们也承受着越来越大的工作压力,加上社区工作者收入水平偏低,社会对他们工作的认同度不高,由此极易产生职业倦怠问题。哈尔滨市S区的社区工作的发展变化是当前新时代社区工作发展变革的缩影,本文对S区社区