基于NER和TF/IDF算法的涉密文件的脱密鉴别方法研究

来源 :无线互联科技 | 被引量 : 0次 | 上传用户:lh923
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络以及各类应用的发展,涉密材料往往在网络渠道传播、流传过程中被泄露,而且往往是涉密材料已经传播一定的范围之后,才能引起相关部门的注意而采用相应的措施.在公开网络产生泄密事件处理过程中,最重要的因素是在泄密材料出现于公开网络并广泛传播之前,发现并确定传播材料是否涉密、可能的来源以及相应的密级.文章提出一种基于NER和TF/IDF算法的涉密文件的脱密鉴别方法,利用NER和TF/IDF算法识别涉密文件中的命名实体,构成矩阵,经过HASH脱密,发送统一中心平台存储.鉴别时,取出文件中各命名实体对应的TF/IDF值乘以出现的次数并求和,其值跟预先设定的阈值比较,以此来确定是否为涉密文件,从而进一步判断涉密文件的来源.
其他文献
智慧校园平台是近年来广受高等教育信息化研究专家和学者青睐的全新概念,它是高等教育领域呼应云计算、物联网、大数据、移动互联等先进信息技术和创新服务模式应用的有效手段,潍坊工商职业学院利用先进网络和信息技术,整合资源,构建高效和实用的信息基础设施.文章从智慧校园平台的建设目标、原则、内容和预期成效等方面,介绍学院信息化建设的思路和做法.
信息化技术的发展与普及,计算机网络技术得到了广泛应用.同时,随之而来的各种计算机网络故障也逐渐增多,需要及时开展故障排查工作,并通过对故障的处理,使计算机网络使用恢复正常.文章对计算机网络的常见故障进行简要分析,并对其处理与维护方法进行介绍,为有关工作人员提供有价值的参考.