文档集合中多重关系的交互探索方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:sfx158158
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学与信息技术的迅猛发展,人类社会在日常生活中产生日益剧增的文本数据,在任何特定领域中大量的文本信息所集合成为的语料库往往超过了一个人可以轻松观察和分析的范围。文档集合不仅包含丰富的语义内容,而且还包含各种文本关系,因此对于文档集合的分析显得尤为重要。现有的一些文本分析的方法主要集中在语义内容或单一种类的文本关系上,无法将文档集合看作一个整体进行系统而全面的从文本内容到文本多重关系的探索。本文定义了一套完整的文本关系并实现了模型构建,并提出了一种可视化方法用来交互式探索文档集合的文本内容以及综合性的文本关系,该方法主要运用了改进的多维尺度变换技术通过投影多个文档节点来编码文档关系,每个节点采用词云技术编码文档中的高频词汇,并且将词云中词语颜色进行处理使得颜色具有相应的意义。该工具集成了一个文本内容与文本关系的概览视图和三个辅助部件视图以支持交互式文档词云节点的查看与探索,文本关系的调整和参考引用等实际关系的观察。本文通过一个真实的论文文献数据集合的案例分析和两个实验评估来证明该方法的有效性和可用性。
其他文献
服务信誉是用户对服务的综合信任程度,客正公正的服务信誉有助于建立用户与服务间的信任关系并推动服务生态系统发展。研究人员通过用户评论构建信誉系统,获取服务信誉,减少用户与服务之间的信息不对称,提高用户对服务生态系统的信任程度,辅助用户决策。然而,由于用户评论的自发性,通过用户评论构建信誉系统,获取服务信誉时存在三个无法忽视的问题,即评论数据稀疏、恶意用户内容、服务信誉计算方法选取。为了计算服务信誉,
神经胶质瘤是成人脑肿瘤中最常见的一种,在原发性脑肿瘤中占据最高的死亡率和患病率。它们可以分为高等级神经胶质瘤(HGG)和低等级神经胶质瘤(LGG)。在本文的研究工作中,我们对于检测核磁共振成像图像(MRI)中的HGG和LGG等多种肿瘤结构提出了一种监督性的分割检测方法,该方法主要基于两种类型特征:梯度特征和上下文相关特征。梯度特征充分利用了二维梯度和三维梯度信息来捕获梯度变化。此外,我们还提出了一
随着移动设备的计算能力的不断进步,目前已经可以在移动端实现增强现实(AR)的特征检测特征匹配等复杂图像处理,但移动AR应用仍然面临很多问题。比如Mark图片与后台图片数据库的匹配速度慢,查询效率低等等。在本文中,本文提出了CloudAR,这是一种基于云架构的增强现实系统。本文详尽地探索了基于云架构的增强现实系统的设计,为了减轻移动端进行图像匹配作业的负担,将繁重的计算任务转移到云环境,由于现有的研
随着多核处理器的普及和移动互联网的蓬勃发展,并发程序变得越来越流行。而由于并发程序的复杂性,并发缺陷广泛存在与并发程序之中,并且已经在世界上带来了重大的经济损失和人身伤害。为了克服并发缺陷,提高并发程序的可靠性,研究人员与相关从业者已经在并发缺陷的暴露,检测,定位和修复上取得了巨大的进步,但依然存在一些棘手的问题没有解决。在并发缺陷定位方向,如何高效快速准确定位导致并发缺陷的根源依旧是个难题。尤其
随着人脸数据集规模的持续增长,科研人员们设计出了各种更快更强的人脸识别网络进行人脸识别,但是对于现有数据集中存在的噪声的来源和后果,人们仍然知之甚少。由于模型是依靠数据进行拟合的,数据的好坏将直接影响模型的最终结果。对于小规模的数据集,可以通过人工标注的方式对噪声进行清洗,但是面对大规模的数据集时,这些存在的问题将无法完全依靠人工来解决。并且清洗数据在一定程度上也会减小数据集的规模,为此,本文围绕
矿体建模是矿山开采过程中的重要环节。本文设计的基于克里格法的矿体三维建模系统,旨在充分利用勘探过程得到的钻孔数据,快速对矿体进行建模,提高地质人员工作效率。本文分析了矿体建模方法的国内外发展现状,研究了克里格法和计算机相关技术,经过对系统的需求分析,确定采用Beego框架作为系统整体框架,使用Mongo DB数据库存储数据,后台主体使用Go语言,结合Java Script和HTML5等技术实现前端
环状流以其优良的传热传质性能被广泛应用于工业生产中,在化工、油气运输、制冷与航空航天等领域都有重要应用。环状流流动参数的测量和特性分析是研究环状流流动机理及传热传质性能的基础。激光诱导荧光技术(LIF)具有非侵入、高时空分辨率等优点,近年来被越来越多地应用于环状流测量领域。本文基于LIF,提出了环状流液膜周向特征参数的测量方法,为研究环状流特征参数的周向分布特性与流动机理奠定了基础。针对介质折射率
过程层析成像技术具有非侵入、可视化等特点,可实现复杂流动介质相分布参数检测。过程层析成像技术可以应用于多相流,医学等领域。常见的层析成像模态包括电学,超声和射线等,每种模态都对被测过程的特定物理参数敏感。电容层析成像技术,电阻层析成像技术与超声层析成像技术作为基于不同物理原理的过程层析成像技术,适用范围及成像特点各有所长,并且超声和电学在其测量参数和敏感场分布上都具有互补性。通过对不同模态测量数据
电阻抗成像技术(EIT,Electrical Impedance Tomography)最早见于上世纪80年代,该技术以电磁场理论为基础,具有可视化、无辐射、污染小、成本低及响应速度快等诸多优点,在工业测量领域,医学监护领域等诸多领域有着诱人的发展前景。但受到测量装置的发展水平、图像重建过程的局限性等诸多因素的影响,现有的EIT的空间分辨率不高,在很多应用场合只能作为辅助测量手段,无法发挥其优势代
在无人机集群的研究领域,仿真技术发挥着重要作用,利用仿真技术可对早期理论成果进行测试验证,并根据测试结果完善系统方案设计。功能完备的无人机集群仿真平台,可帮助研究团队快速完成研究周期中各阶段设计原型的测试与验证,从而缩短研究周期、降低研究成本。本文致力于为无人机集群编队的理论研究提供一个综合型仿真平台,具体包含实时仿真验证、三维视景演示、人在回路交互控制等功能,在调研国内外研究现状的基础上,设计了