论文部分内容阅读
市场竞争日益激烈,为了减少复杂多变的企业竞争环境中的不确定因素,越来越多的企业开始逐步构建竞争情报系统。企业竞争情报具有不完备性、对抗性、广泛性、时效性等特点,在其采集过程中遇到许多障碍。本文以某大型化工企业知识管理中心为应用对象,研究企业竞争情报采集系统,具有重要的理论和应用价值。
研究分析目前的国内外情报采集软件,由于信息渠道堵塞、经营壁垒等原因,企业竞争情报大多缺失或不完整。针对这种情况,本文采用粗糙集理论和方法指导网络蜘蛛的爬行,提高企业竞争情报采集效率和采集速度,进而为企业经营决策提供准确可靠的经营依据。
在企业竞争情报采集系统中引入分布式网络蜘蛛,将其训练为Surface Web爬行和Deep Web爬行。因专业数据库的相对重要性,对行业数据库和文档知识库中信息加以特别获取机制,尽可能指导其深入行业领域资源进行高效深度地采集。同时,为防止网络蜘蛛过度深陷于某些链接陷阱,提高其自学习性,设计整合立即回报价值和远期回报价值搜索策略。将巩固学习纳入链接结构的搜索策略中,对网络蜘蛛进行有效的训练,并通过粗糙集理论加以引导,提高其自适应性。
研究设计的工作流程为,首先对采集参数进行相似类拓展,在该范围内加之巩固学习机制,引导网络蜘蛛爬行;其次,在采集过程中,采用不完备信息系统中的缺省值处理方式,在一定程度上避免因竞争情报的部分保密而错失有效的情报;继而,对参数进行相似匹配,通过粗糙集的分类优势,自动识别采集对象与参数间的可区分度和不可区分度,进行情报采集;最后,基于可区分度基础上对采集对象进行属性约简,自动分类,优化竞争情报知识库。将该情报智能采集系统与企业原采集工具进行比较测评,实验结果数据表明,在处理速度和采集有效性方面有明显提高,且降低人工操作要求,体现了企业竞争情报采集系统的智能性和可操作性。
研究成果被实际应用于某大型化工企业知识管理中心建设过程。本文针对竞争情报缺失情况下的企业竞争情报智能采集系统的研究成果为企业竞争情报采集研究的实际应用奠定了理论和技术基础。