科学文献的主题演化可视分析研究与实现

来源 :四川大学 | 被引量 : 0次 | 上传用户:suitky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学文献是科研人员通过实验对自然科学现象进行充分观察或研究后,对成果与结论的书面表达。海量科学文献的发表使科学的结构不断发展与完善,对科学发展中的重要影响因素进行深入了解可以有效地解决环境、社会和技术问题。通过分析科学文献数据,揭示学科主题结构及发展历程,对理解学科特点、发现新兴研究以及预测未来趋势至关重要。围绕科学文献,现有研究只关注学科框架的构建或单研究领域的主题分析,缺少完善的从学科层级自顶向下进行细节探索的分析流程。在文本的主题可视分析方面,现有方法无法同时展现主题间的相关关系与时序变化情况,同时对跨领域相关主题分析的研究工作较少。针对上述不足,本文以计算机科学为例,基于学科内代表性会议文献数据,结合分析人员实际需求,利用可视分析方法实现“从学科到研究领域再到主题”的分析过程,具体研究内容与相关成果如下:1)构建科学文献的主题演化可视分析模型。围绕文献数据特点,从整体、个体、交叉影响三个层面出发定义可视分析任务。通过文档向量、主题建模等技术实现文本信息挖掘。通过任务驱动的形式,构建可视分析模型,并依此提出多种可视化方法。2)提出一种基于投影的文档语义可视化方法,旨在帮助用户理解学科的整体构成。该方法使用散点图与等值线图结合的方式对文档的分布关系进行呈现,使用位置近邻表示文档的语义相似性,使用等值线表示领域的语义覆盖范围。该方法支持时间刷选交互,帮助用户理解学科发展随时间的演变情况。同时该方法加入了一个局部透镜,通过添加作者、关键词等额外信息帮助用户理解视图区域含义。3)提出一种基于流图隐喻的主题树可视化方法,旨在帮助用户理解领域的主题结构与时序演化。该方法将流可视化方法融入到径向布局的树可视化方法中,实现主题树布局。结合基于聚类的时间分片算法,完成主题发展阶段划分。提供高亮、刷选等交互手段协助用户完成主题树探索。4)改进基于相关性的桑基图可视化方法,旨在探索跨领域的主题影响,如机器学习技术在可视化领域的应用。该方法通过主题相似性的度量与主题间领先滞后关系确定,刻画主题间的影响。采用排序、过滤等交互方法进行视图简化,帮助用户完成主题相关性的探索。基于上述模型和方法,设计并实现了科学文献主题演化的可视分析原型系统。该系统提供以多视图联动为主的多种灵活交互手段,辅助分析人员完成主题结构分析、时序演化分析及交叉影响分析等任务。通过计算机科学场景下的案例实验分析与专家评估,验证了上述模型和方法的有效性和可用性。
其他文献
飞行模拟机是训练飞行驾驶员在地面上虚拟飞行的有效设备,飞行模拟机给飞行驾驶员带来真实感的原因之一就是它逼真的视景系统,可以将飞机上可见的一切视景以虚拟的方式呈现在飞行驾驶员的眼前。当训练飞行驾驶员时,除了起飞和降落的场景都是在空中,所以云是飞行驾驶员在空中最常遇见的场景也是飞行模拟视景仿真中不可或缺的场景。相对于游戏或影视中的三维云场景而言,飞行模拟机中的三维云场景有着不一样的需求,第一,云层在飞
室外的场景通常有大气中的混浊介质存留,由于大气的吸收和散射形成了雾霾。图像采集设备受到雾霾的影响,导致获取到的图像清晰度降低、对比度下降,严重时还会导致色彩和细节信息发生变化或失真。近年来,计算机视觉技术已经普及和深入到各个行业的应用当中,在道路、航空等领域发挥着越来越重要的作用,而雾霾天气严重威胁了交通的安全。为了各类计算机视觉系统在雾霾环境下能正常工作,使得后续开展的图像分割、目标检测、图像识
近年来,合成孔径成像(Synthetic Aperture Imaging,SAI)系统中的光场成像受到研究人员的广泛关注。与传统的单个相机只能记录场景光线的二维平面信息不同的是,光场成像不仅记录场景的二维平面信息,同时记录场景光线的角度信息。由此,可以通过设定不同的参数获得不同焦距、景深(Depth of Field,Do F)的图像,在图像处理上带来了极大的便捷。利用计算成像的这些特性,也为视
颈椎作为承载人体头部的重要部分,头部的所有运动都是颈椎运动耦合的结果。随着社会发展,人们室内工作时间增加,长时间的久坐成为颈椎病发生的常见原因,最近颈椎病患者有年轻化的趋势。临床医学主要靠人体颈椎能够运动的角度范围来对颈椎正常状态进行诊断,目前临床上主流的检测颈椎运动角度的方法是利用影像医学,一般是通过拍摄颈X片的方式来评估颈椎运动功能。一种方便医生与患者的颈椎活动角度测量方法对于医生对患病程度判
随着互联网的不断发展,移动应用的需求快速增长。移动应用的质量保证是决定其成功的主要因素。测试自动化可能是提高移动应用程序质量并降低测试成本的有效解决方案,但实现移动应用的自动化功能测试是复杂且困难的,它是一项昂贵且耗时的活动,并面临诸多挑战。目前主要面临两大挑战,即测试序列自动生成和测试Oracle自动获取问题:(1)如何自动生成功能测试的测试序列,以达到自动化功能测试的目的?(2)如何自动获取测
区块链作为一种去中心化的新型分布式计算范式,具有多方创造信任、安全自治、不依赖可信第三方等特性,得到了越来越广泛的关注和应用,从最初的数字货币应用场景,逐渐拓展到了金融、贸易、征信、版权保护等诸多行业领域。联盟链相较于公有链拥有更高的交易性能和良好的监管特性,广泛受到各组织机构的青睐,其应用场景也在各行业领域得到了极大的拓展。联盟链在发展和应用过程中也遇到了各种问题与挑战,特别是联盟链的可扩展性问
人体行为识别是计算机视觉中一种重要的场景分析技术,目前已经得到广泛应用。基于视频的人体行为识别方法存在识别率不高的问题,这与视频帧提取中关键信息丢失、冗余信息较多等因素有关,也与在面对复杂场景时,使用单一特征难以对人体行为进行充分表达等因素有关。本文针对关键帧提取和人体运动视频的多特征表达进行研究,主要工作和创新点如下:(1)针对基于关键帧提取的人体行为识别,提出了一种基于动态双向时空切片聚类的关
随着科技水平的提高和社会的发展,在物质生活已经得到满足之后,人们开始更加关注精神生活的水平,很多丰富精神文明的商品成为大家追逐的目标。其中,智能手机和家庭影院的普及,让人们能享受到更好的拍摄和观看的体验。但光学领域的研究中,由于镜头的透镜在生产时无法达到理想的精度而且在组装过程中也可能产生偏差,最后会使得到的图像产生畸变,影响人们的观看体验。相机镜头产生的畸变按种类分为:径向和切向。径向畸变是因为
如今,从网上购物、视听娱乐到生活旅游等方面,人们的日常行为和决定越来越多地受到推荐系统的影响。所谓推荐即是根据用户的历史、项目的相关属性进行建模,从海量的信息中,推断出用户的兴趣爱好,帮助用户找到感兴趣的项目。推荐系统的技术核心是如何从巨量信息中为用户挖掘出有效的信息。然而,传统的推荐算法里已有的数据稀疏性问题,会致使推荐质量不太理想,无法更好地提升用户对系统的满意度。再而,因缺少系统给出的推荐结
运动目标检测是许多视频分析应用中的关键步骤。由于真实视频数据通常存在相机抖动、光照变化和恶劣天气等复杂情况,导致基于背景减法的目标检测算法可能无法有效对背景信息建模,严重影响目标检测效果。因而具有鲁棒效果的鲁棒性主成分分析(Robust Principal Component Analysis,RPCA)在目标检测领域得到广泛应用。虽然RPCA模型被成功应用于目标检测领域,但是在经典RPCA模型中