容器画像建模及画像标签生成研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:abc000123444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着轻量级虚拟化技术的发展及产业界对软件系统持续部署、持续集成、持续交付的需求逐步提升,容器作为新的软件单元,以其“一次构建、处处运行”的特点推动了软件开发的革新进程。然而,由于容器特征难以获取,以及容器知识未被充分挖掘,影响了容器管理和容器推介等应用场景。因此,收集容器信息并挖掘获取容器知识对未来容器相关的应用场景具有重要意义。在软件仓库挖掘领域中,容器仓库挖掘已成为该领域的新兴研究方向,现有方法侧重于在较低层次或单一方面对容器仓库进行分析,缺乏对容器系统、宏观性的研究,尤其缺乏对容器功能及非功能特点的高维语义信息挖掘。本文工作的主要目标是分析容器的多类描述信息,构建以层次化标签体系结构为基础的容器画像,实现容器画像建模。在容器画像的设计驱动下,研究容器画像标签的生成机制,从挖掘容器本身特点的基础标签到挖掘描述容器功能及非功能特点等高维语义标签,支持未来云计算、容器检索、容器推介等对容器知识存在需求的应用场景。本文主要工作包含以下三大部分:第一,提出了容器画像,构建了多层容器标签体系结构,并结合与容器相关的数据信息及数据特点,设计了各层标签结构所包含的标签类型。第二,在容器标签体系结构设计的驱动下,建立了容器画像标签生成机制,该机制从多个角度,运用多种方法分析容器信息。针对容器相关的短描述信息,设计了基于TF-IDF(Term Frequency Inverse Document Frequency)的关键标签抽取方法,该方法用于抽取表征容器独特性的标签信息,设计了基于层次聚类的一般标签抽取方法,实现了容器一般特征标签信息的抽取。针对容器的长描述信息,提出了面向长文本的基于LDA(Latent Dirichlet Allocation)主题模型的标签生成方法,以主题模型的方式为容器生成相关标签。此外,本文提出了基于BRT(Bayesian Rose Trees)和MCG(Microsoft Concept Graph)概念图谱的标签生成方法和基于Word2Vec和Word Net知识库的标签生成方法,分别从语义的纵向和横向两个角度生成扩展标签。该机制对容器文本描述信息从简单抽取和关联挖掘分析,再到主题挖掘和标签扩展生成,在语义上层层深入地挖掘了容器知识。第三,设计实现了容器画像标签抽取工具,并实验评估了容器画像标签生成机制中的方法。实验表明,本文所提出的容器画像标签生成机制能够通过容器文本描述信息抽取标签,并且支持在已有标签的基础上生成扩展标签。
其他文献
随着互联网和信息化的发展,网络中的信息量与日俱增,给我们生活带来极大的便捷。目前记录信息的方式有文字、图片和视频等多种形式,但我们仍主要以文字作为信息记录的载体。自然语言处理是一门融合人工智能以及语言学的交叉学科,通过表示、分析和处理文本信息,突破计算机和人类的交互方式。从大量文本信息中挖掘发现有用信息已经成为许多研究者的研究方向,实体关系抽取是自然语言处理中的一个研究方向,通过从包含命名实体的句
学位
目前大型物流分拣中心大多采用以交叉带分拣机为代表的流水作业分拣方式,但在分拣入口的快递信息筛选、出口处快递整理与搬运等环节大多是通过人工方式进行,从而造成了分拣效率低且错误率高的问题,极大的限制了物流运输效率。为了解决上述问题,本文设计并搭建了智能快递分拣系统,从而有效提高了分拣效率。具体内容和研究成果如下:第一,针对堆放杂乱无序、相互遮挡的复杂场景下快递检测识别精度低的问题,提出了一种基于通道信
学位
学位
哈萨克斯坦是我国的世代友好邻邦以及“一带一路”倡议的首倡之地和先行先试地区。随着“一带一路”倡议的不断推进,中国在哈萨克斯坦媒体中的国家形象研究越来越受到各学科
由于独特的电磁和物理化学特性,纳米级金属体系结构在电子,Micro-Electro-Mechanical System(MEMS)设备、诊断、生物传感、光谱学和显微镜学领域越来越受到关注。在不同的自组织外延生长方法中,液滴外延生长的显着优势是它的灵活性,因为它既适用于晶格不匹配的系统,又适用于晶格匹配的系统。自Koguchi等人的初期工作以来,在Ⅲ-Ⅴ族半导体上观察到了各种点状、环状、和孔状纳米结
作为MANET的重要分支之一,由多无人机(UAV)组成的飞行自组织网络(FANET)具有更大的灵活性和机动性,特别适用于农业遥感、交通监控、应急救援及军事等复杂任务场景;与此同时,F
GPS是比较成熟的室外定位技术,然而它在卫星信号被部分遮挡的室内环境中定位精度并不高。针对这种情况,研究者提出了各种室内定位技术。室内定位技术包括主动定位和被动定位两种方式。被动定位与主动定位技术相比,定位目标不需要携带设备,能满足新兴的市场需求。目前,由于很多室内环境中WIFI密集部署,并且其应用限制小,能够在不被察觉的情况下实现定位,所以本文主要研究基于WIFI的室内被动定位技术。CSI能提供
随着计算设备的智能化发展,机器视觉技术得到了广泛应用,如果想要使智能设备实现与现实世界的感知与交互,必须先要恢复它的三维空间场景。其中即时定位与场景重建(Simultaneous Localization and Mapping,SLAM)作为智能设备在未知环境中实现自主导航和场景建图的关键算法越来越引起人们的重视。同时,现阶段的SLAM三维重建工作主要集中于对静态环境的重建,若环境中存在动态物体