论文部分内容阅读
互联网已经成为信息的主要载体之一,基于网络的研究在数据获取方面越发的容易,网络数据分析是伴随着现代网络技术的应用出现的一个较新的研究领域,它具有复杂性、多维度和时变性等特点。人们已经习惯在网络上分享信息,结识新的朋友等;基于微信、微博等社交app,可以迅速发布身边正在发生的事情,因此社交媒体相对传统媒体(如报纸、电视新闻等)具有很好的竞争力。企业可以对巨大的网络数据进行挖掘分析并发现潜在的商业价值,甚至能通过基于网络的各种平台去直接影响客户,同样客户同样可以从网络数据中获取信息来了解公司的方方面面,以达到指导和决定投资的目的。因此对互联网数据进行可视化分析有非常大的商业价值和分析意义。在这篇文章中,首先尝试对微博数据进行时域空域分析,并将两种分析结合在一起,提出了基于薛定谔方程和尼尔斯波尔原子理论的电子云可视化模型(ECM),电子云可视化模型把通过情感分析得到的情感值依据一定的规则映射到电子的稳定性参数,主要用来做微博情感的时域可视分析;其次对微博数据进行基于地理的可视分析,并将核函数密度估计和边绑定应用到可视分析中,核函数密度估计能够很自然地在不同层次可视情感变化,边绑定可用来减少边交叉导致的视觉杂乱,同时能揭示边在更高层次的变化规律,最后实现了微博情感分析系统,并对三个微博事件进行了可视分析及结果分析。本文还对网络上收集到的企业数据进行实体及实体关系抽取等前期处理,进而构建满足企业、个人等需求的企业知识图谱,并对企业知识图谱可视化过程中遇到的问题进行分析,本文使用经典的力引导算法来构建知识网络,进一步在网络可视化的基础上进行集合可视化,针对出现的集合路径交叉问题引入集合因子,解决了在网络图基础上进行集合可视化效果中集合路径交叉过多的缺点,并与之前可视化结果作了对比分析;实现了简单的企业知识图谱系统,主要由以下几个功能部分:企业基本信息、相关企业、知识网络、知识网络中节点的信息及企业相关的事件的时间线表达,最后对平安数据进行了可视分析,并对结果做了分析与对比。