问题驱动型自动综述关键技术研究

被引量 : 0次 | 上传用户:zhuspecial
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来科技论文增长速度持续上升,数量庞大的文献资源为科研人员带来机遇的同时也带来了挑战:科研人员需花费大量时间和精力去阅读相关领域文献来获取研究前沿、研究热点、存在问题、主要技术等重要信息。针对该现状,如何快速、高效的进行信息的挖掘和归纳尤为重要。自动综述技术能够实现已有文献内容信息的归纳和提炼,是应对海量学术资源的重要手段,对科研工作乃至管理部门决策均具有重要应用价值。现有自动综述相关研究多是按照句子、主题或语步进行综述组织,其中主题级自动综述能够覆盖到更加全面的子主题信息,而语步级自动综述在文档结构上更加合理。实现自动综述的相关技术方法包括计量+浅层语义分析和文本摘要两大类,前者能够获得相对宏观的归纳性信息,后者则能够深入到文本内容,实现内容层面的归纳总结。尽管自动综述相关研究已有一定基础,但还存在以下不足:(1)在内容组织上,缺乏满足问题驱动型科学研究范式应用需求的自动综述组织形式;(2)在技术方法上,计量+浅层语义分析通常分析层次较浅,归纳的结果需要进一步专家解读;自动摘要方法生成的文本存在缺乏语义逻辑关系、内容割裂等问题。针对以上问题,本文面向问题驱动型科学研究应用需求,采用计量+浅层语义分析与文本摘要方法结合的方式,构建问题驱动型自动综述技术框架,并提出解决技术框架中关键技术问题的方法,最终生成以“发现问题-解决问题”为组织逻辑、具有较强可读性的问题驱动型综述文本。具体而言,主要开展了以下工作:(1)问题驱动型自动综述技术框架设计。根据综述文档的结构与内容特征、问题驱动性研究范式的特点,提出实现问题驱动型自动综述需要解决的三个关键技术问题:如何进行主题相关问题实例的识别与归纳;针对存在的问题,如何识别和归纳解决问题的方法实例;如何对主题相关描述性信息进行归纳总结。并据此构建了问题驱动型自动综述技术框架。(2)主题-问题实例识别与归纳方法。提出了主题级问题实例识别方法,将问题实例识别任务看作基于主题的候选短语分类任务,采用句法分析工具建立句法依赖树、抽取候选短语,构建句法依赖增强的主题-问题实例识别模型,模型通过Transformer与Bi GCN学习句法信息,并通过两者交互的方式实现两类信息的相互增益,采用基于主题的注意力模块判断候选短语是否为给定主题的问题实例,模型识别准确率为84.6%,相比基线模型提高了2.3%;提出了以Leiden社团聚类算法为主体的细粒度问题实例归纳方法。(3)问题-方法实例识别与归纳方法。现有方法实例识别模型很少考虑方法的使用主体,本文提出了的特征增强的序列标注模型用于方法实例的识别,模型在BERT原有三类输入特征的基础上,增加了词性特征和提示特征以帮助模型判断方法的使用主体,模型识别准确率为90.2%,相比基线模型提高了6.1%;通过词形还原、缩写原型合并、去尾操作和编辑距离的方式实现相同方法实例的合并。(4)主题-描述语句识别与归纳方法。将R-GAT应用于主题级描述语句的识别,该模型能够学习句子的综合句法信息,关注到与主题具有句法依赖关系的上下文,在主题级描述语句识别任务中识别准确率为95.48%;提出多层级描述语句归纳方法,该方法采用Sentence-BERT计算句子级和关键词级两个层次的相似度,以同时捕捉句子的全局相似性和重要信息相似性,对Text Rank的句子打分结果应用MMR多样性重排序算法,以兼顾归纳结果的重要性和多样性。(5)在实现自动综述关键技术的基础上,设计了问题驱动型自动综述生成模板,将归纳总结的信息按照模板进行组织,形成最终的综述文本。此外,在实证研究中以“community detection”为主题,通过与已有文献综述对比、专家评价等方式验证了所提方法在主题相关问题归纳、问题相关方法挖掘、主题相关描述信息归纳以及综述文本生成任务中的有效性,生成的综述文本在专家评价中总体打分为4.2,说明本研究提出的综述方法能够较好的满足用户需求。本文的主要研究创新如下:(1)提出了问题驱动型自动综述技术框架,相比其他自动综述形式,本研究以“发现问题-解决问题”的逻辑进行综述内容组织,更符合我国科技创新大环境下对于问题驱动型研究的需求,目前较少有研究在自动综述中体现问题驱动的思想。(2)提出了句法依赖增强的主题级问题实例识别模型。现有问题实例识别研究中,均未考虑主题与问题之间的对应关系。本研究将问题实例识别任务看作候选短语分类问题,构建了句法依赖增强的主题级候选短语分类模型,能够有效识别给定主题对应的问题实例。
其他文献
以课程的定义为切入点,从课程的理论基础包括哲学、心理学、社会学等三方面总结影响课程发展的要素以及与这些要素的关系,以期对新时代新形势下的课程发展方向和趋势有一定的启示。
仁爱思想是中国儒家文化的核心要旨。黑格尔曾认为孔子的思想不过是一些道德格言,没有形成以逻辑推理为支撑的体系化思想,不能被视为真正意义上的哲学思想。以仁爱为核心的儒家文化是否真的不拥有体系化的思想?散见于儒家不同元典中的仁爱思想仍然存在着隐性的理论体系。这包括仁爱思想的致思维度、以仁为本的道德本体观以及仁爱的理论要旨。以体系化的研究方式研究仁爱思想能够彰显仁爱思想对中国思想史的重要影响,还原儒家思想
课程思政视域下加强劳动教育既是高校落实立德树人根本任务、培养堪当民族复兴大任的时代新人的必然要求,也是新时代践行社会主义核心价值观和促进大学生全面发展的题中应有之义。目前部分高校劳动教育中存在大学生劳动体验不足,劳动教育呈碎片化、现实化倾向,劳动教育评价有待完善等问题。对此,高校应该积极探索增设劳动体验课程、建立健全劳动课程体系、聚焦大学生实际生活、完善劳动教育评价等实践策略。
采用荧光定量PCR技术分析BjuFIP在不同非生物逆境胁迫下的表达模式.通过无缝克隆技术将BjuFIP的CDS序列构建到原核表达载体pGEX4T-1上,测序正确后转化大肠杆菌表达菌株BL21,对BjuFIP-GST蛋白进行体外诱导表达纯化.结果表明,BjuFIP-1显著受低温(4℃)、高温(37℃)和NaCl的诱导表达,BjuFIP-2显著受低温(4℃)、高温(37℃)、ABA、NaCl以及Man
马克思恩格斯在创立马克思主义科学理论的时候,通过对资本主义社会的意识形态进行批判,形成了马克思主义意识形态理论,它指导着无产阶级革命和社会主义建设。新中国成立后,我国十分重视社会主义意识形态建设,在社会主义建设的不同时期进行社会主义意识形态建设的探索实践,推动着社会主义意识形态建设的创新发展。在进入建设中国特色社会主义的新时代,我们要在坚持“四个自信”的基础上,以文化自信推动社会主义意识形态建设迈
随着社会的不断发展进步,社会各方面对教育行业越来越重视,教育的好坏直接对学生的学习以及对学生以后的人生发展都有着极其巨大的影响,基于此,各个学校进行相应的改革,对学生进行全方面的培养,促进学生全方面的发展。而在中职院校当中,计算机组装与维修是非常重要的一门课程,其有着较好的实践性和理论性,对于学生的全面发展有着至关重影响。但是中职院校在计算机组装与维修的教育方式上存在一些问题,教学的效果并不理想,
"双减"的出台,标志着教学方法的转变,以促进学生全面发展和核心素养培养为重点。学科融合的教学不仅可以达到这种目标,而且还可以促进教师教学水平的提升。《课程标准》中明确提出了"让学生们体验到数学和其他学科的关系"这一理念。为此,论文探讨了双减背景下小学数学基于学科融合与实践教学路径,以期为相关教育工作者提供参考。
难溶性药物由于溶解性和溶出度较低,限制了其在体内的吸收分布,进而影响药物发挥药效,是药学研究的热点之一。固体分散体可以提高难溶性药物溶解度,采用喷雾干燥技术制备固体分散体,由于其良好的干燥效率和工艺重现性,近年来备受关注。本文对喷雾干燥的工艺步骤、设备类型及制备固体分散体常用聚合物等作一综述,并分析讨论了影响固体分散体关键质量属性的因素,探讨了喷雾干燥技术应用生产的困难和挑战。
目的了解临床分离的常见革兰阴性杆菌的分布及耐药情况,为临床合理用药提供依据。方法对2006年1-12月临床送检各类标本中培养分离的697株常见革兰阴性杆菌,采用WalkAway-40全自动细菌鉴定及药敏测试仪以及NC31鉴定板进行分析。结果最常见的革兰阴性菌株为铜绿假单胞菌、大肠埃希菌、肺炎克雷伯菌、阴沟肠杆菌、鲍氏/溶血不动杆菌与嗜麦芽寡养单胞菌,其检出率分别为24.25%、23.67%、21.
自然观察智力是加德纳提出来的多元智力中的第八种智力,在幼儿的身心发展中发挥着重要的作用。在具体的幼儿教学活动中,幼儿园教师要注重培养幼儿的自然观察智力。自然观察智力可以让幼儿正确识别动物群与植物群,并且对自然界中包含的物种进行科学分类,提高幼儿对生物科学和农业生产的有效领悟,另外,能够增加他们的生活经验与生活技能,使他们掌握认知世界的各种技能。幼儿教师在实际工作中,要注重教学的技巧与方法,结合幼儿