基于文本挖掘技术的情报处理方法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:sqlservermaintenance
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一直以来,情报机构的主要职能是将搜集汇总的大量情报素材加以分析研究,形成情报产品后提供给情报用户,以利于情报用户决策。而在情报机构处理的各类情报素材中,公开来源的文本素材是所处理的情报素材的重要组成部分。而随着近年互联网技术的飞速发展,由网上电子文档、电子邮件、数据库等形式承载的文本信息量正不断爆发式地增长,情报素材来源极大丰富,传统的情报处理方法已经越来越难以满足任务需要。与此同时,情报用户的情报需求越来越旺盛,时效要求越来越高。如何从浩瀚的互联网公开信息中挖掘出有用的文本信息并对其进行高效率的处理上报,业已成为当前情报机构急切需要解决的重要问题。针对当前情报机构面临的情报质量和情报效率两个现实问题,本文尝试利用文本挖掘的相关技术,对情报机构所获情报素材开展预处理、分类和价值挖掘研究,探索提高情报处理效率和从零散情报素材中发现情报价值有效方法。本文主要工作有:一是情报预处理技术研究。情报文本分词是预处理的关键环节。本文结合情报处理工作实际需要,提出了基于专门领域的情报词典的分词策略,同时构建了一个简单的情报专业领域词典,有效地提高了情报文本的分词准确率。二是情报分类研究。本文利用KNN(k-nearest neighbor)分类算法进行情报文本的分类。分析了KNN分类方法的不足,采用改进KNN的方法进行了分类系统设计;通过对比实验发现,改进后的KNN分类方法比改进前分类准确性和效率都有明显提高。三是情报价值挖掘研究。本文利用关联规则算法推导军事情报的要素之间的强关联规则,利用Apriori算法进行情报价值的深度挖掘。针对军事情报分析工作的特点,本文采用优化后的Apriori算法,着眼于情报要素重要性差异,将重要性大的情报要素赋予较大权值,将重要性小的要素赋予较小的权值,从而挖掘出更多可靠而且潜藏的情报结论。最后,本文对情报素材进行预处理、分类和价值挖掘后,基于海空军事目标的位置关联性,尝试研究情报报告自动生成方法。本文的研究工作和研究成果对于情报实践这一专业领域的文本挖掘技术研究有一定的理论意义;尤其是将文本挖掘技术与现实情报工作流程相结合,可以有针对性地提高情报处理工作的效率和有效性,对现实情报处理工作具有一定的参考价值。
其他文献
根据广义模块化设计原理 ,对广义模块化产品族和产品平台作了整体规划 ,阐述了柔性模块、虚拟模块、元结构以及柔性元结构等概念 ,提出了以柔性元结构为基础构建广义模块化产
<正>萃取是学生进入高一年级新接触的混合物分离和提纯的方法。传统的教学过多地关注萃取和分液操作的规范和训练,而萃取与分液原理多为灌输式讲解,教学内容单薄而枯燥,学生
目的探讨无缝隙护理管理模式对外科ICU院内感染的影响。方法选取2014年12月-2016年1月外科ICU 100例术后患者,采用随机数字表法将其分为对照组和观察组各50例。对照组采用外
历史学家黄仁宇以研究中国财税史见长,他有个著名的提法,叫从“技术的角度”来看历史。这里的技术并非指科学技术,而是指财税制度、货币信用制度等经济管理的技术。从技术角度看
为了解决变压器故障诊断中存在的随机性和模糊性问题,提出了基于反馈云熵模型的电力变压器故障诊断新方法。通过对大量电力变压器故障征兆及故障类型的统计分析,并将其视作云
本文运用深沪两市57家电力行业上市公司2006年的数据,采用多元线性回归分析方法,从内外两种治理机制对公司绩效的影响进行了实证分析。结果发现,电力行业上市公司的治理结构
 作为一门社会史和文化史交叉的新学科,“社会文化史”是近年来国内外学术界的一个新趋向,已经引起了国内学术界的广泛注意,并取得了一些可喜的研究成果。尽管从总体上说,它
本文以上市公司的债务融资成本为切入点,探讨了我国上市公司实施新会计准则的经济后果。以2002—2011年我国A股上市公司的数据为样本,研究发现,新会计准则的实施会对非国有控
目的分析胸腺肽肠溶片联合地氯雷他定治疗慢性特发性荨麻疹(CIU)患者的疗效及复发情况。方法选取2015年3月-2016年7月收治的76例CIU患者临床资料,将其分为对照组(38例)、观察组(38
中央企业改制先后经历了从特大型中央企业的“存续分立”到大中型企业“主辅分离”,然后到当前的大型中央企业“整体上市”这样一个发展历程,“整体改制、整体上市”是下一步中