基于KPS的Web信息抽取MAS模型的研究与设计

来源 :南昌大学 | 被引量 : 0次 | 上传用户:zb3637607
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、通讯技术的飞速发展和个人计算机的普及,Internet作为一个全球网络,越来越融入到人们的生活、工作、学习、商务活动中。而Web在给我们带来便捷、快速、廉价、丰富的信息的同时,也给我们带来了一个问题。Web上浩大的信息量和用户的需求之间产生了严重的不平衡和矛盾,人们很难在短时间内在海量的信息中找到自己真正感兴趣的数据,于是人们对高效率的信息获取技术的需求越来越迫切。Web信息抽取系统,可以使人们高效地获取真正感兴趣的信息,并可在此基础上进一步完成数据挖掘,信息检索等后续信息处理,为海量的Web信息的再利用提供了可能,因此有着明显的优势和广阔的应用前景,是当今多个领域的研究热点。Agent系统是目前计算机科学领域中一个非常重要、研究活跃的内容。Agent系统特别适合复杂、难以预测、动态变化的问题的处理。Internet固有的开放、分布、异构、复杂等特性为Agent提供充分的应用基础。多Agent系统(Multi-Agent System)是由多个Agent协调合作所形成的问题求解网络。多Agent系统中的每个Agent都有它自己独立的局部知识库、目标和能力,Agent之间能够协调相互之间的行为,通过协商解决冲突,通过合作达到共同的目标。在现有相关研究的基础上,本文提出一个基于KPS(Keywords,Patterns,Sample pages)的Web信息抽取的多Agent系统(MAS)模型。基于KPS的Web信息抽取方法集合了分别基于关键字、模式和样本的信息抽取技术的优点,有利于满足抽取高精度、高复杂度和高性能信息的要求。一个多Agent系统(MAS)可以把问题由大化小,由复杂变简单,每个Agent完成一个小目标,Agent间通过协调和合作,共同完成复杂的Web信息处理。而将基于KPS的Web信息抽取方法与多Agent系统进行有机的结合,可以大大降低Web信息抽取的难度,提高信息抽取的精度,从而更大地满足用户的需求。
其他文献
随着计算机与网络技术的迅速发展,现代办公自动化(OA)系统的定义已由原来简单的公文处理扩展到了整个企事业单位的信息交换平台,并实现了与系统支持平台的无关性,其功能已有极大
自1965年L.A.Zadeh提出了模糊集合以来,关于模糊系统的研究得到迅猛发展,这种研究在理论与应用方面都取得了丰硕的成果。特别是模糊控制技术被广泛应用于工业控制与家电产品的制
近些年来,计算网格技术在国内外的迅速发展,对计算资源的共享利用产生了巨大的推动作用。本文以建设成都理工大学校园计算网格为目标,在结合现有技术和成功案例的基础上设计了成
爸妒侨绾位竦玫?”、“知识以什么形式出现?”、“知识是如何被利用的?”这些都成为人工智能研究中最为基本的问题,在这些问题中知识又是一切研究工作的基础。所以,人工智能
本文分析了目前的量仪市场和量仪的发展趋势,结合当今计算机技术,使用嵌入式ARM-Linux系统,研制一款用于汽车机械部件测量的智能仪器。 文章按照研发过程,介绍了此款量仪的全
高血压是中老年人群中非常普遍的慢性病,也是引起心脑血管病等并发症最主要的危险因素,其引起的心力衰竭、脑卒中及慢性肾脏病等疾病,不仅有较高的致残乃至致死率,而且严重消耗了
随着国际化的发展,辽宁工程技术大学正在兴建一个国际学术期刊资料库,里面需要大量的英文PDF文档资料,本论文的设计目的就是要给这个资料库提供一个高质量的web全文检索服务,
众所周知,人类通过视觉获取的信息约占其获取总信息量的70%,视觉信息具有直观、可靠等优点。近年来,随着计算机网络、通信技术和多媒体技术的飞速发展,整个世界对网络视频方面的投
随着因特网的发展,人类的社会活动开始广泛使用人工智能技术,该技术的应用发展通常需要构建不等规模的知识库来为其做后台数据支撑。而知识库的建设往往需要从海量的半结构化
本文对特征选择算法研究及其在孤立性肺结节诊断中的应用进行了研究。文章提出了一种新的基于粗集(RS)与遗传算法(GA)的特征选择算法。该方法将遗传算法(GA)与粗集(RS)思想有