基于agent的internet信息自动提取的研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:mmcemil
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet以及相关技术的发展与成熟,Internet,尤其是WWW逐渐成为人们发布和获取信息的常用平台,从网络上收集信息资源已经成为当今至未来社会人们获取信息的重要手段。然而,面对汪洋大海般的网上信息,一个普通用户使用现有手段是很难招架的。这又包括两种情况:1 主动送上门的或已经下载的信息难以消化,即所谓的“信息过载”;2用户不知道如何确切表达(目前技术也并没有提供合适的表达手段)对真正想要的网上资源的需求,也不知道如何更准确、有效地寻找资源,即所谓的“资源迷向”。 基于Agent的Internet信息自动提取的研究是一种面向个人用户和一般企业用户的实用智能化信息获取Agent,它可以通过反复学习,掌握用户的兴趣特征,自主在lnternet上搜索用户感兴趣的信息,并且将找到的信息经过过滤后提供给用户,实现智能化的主动信息服务。根据用户的偏好和反馈训练Agent,及时获取用户感兴趣的最新信息,从而获得个性化服务,帮助用户解决“信息过载”和“资源迷向”。 文章系统介绍了智能代理,机器学习和汉语分词技术,其中着重研究了Agent的智能性,代理性,主动性。本系统结合了这几种技术,集中建立一个基于Agent信息自动获取系统。 本文的系统划分成三个子系统:数据采集子系统,数据过滤子系统,机器学习子系统。三个子系统通过知识库有机的结合在一起,并尽可能地在系统的各个环节利用Agent的思想提高智能化,并对传统的分词算法,归纳学习算法做了融合和改进。
其他文献
在过去的几年里,因特网技术在全球范围内飞速发展,越来越多的企事业单位和个人用户连接到了Intemet上,由于TCP/IP协议本身的安全性考虑不足,网络安全问题也就越显突出.通常来
随着internet的高速发展,大量的信息需要通过网络进行传送,存储和处理。对网络的带宽和存储能力提出新的更高的要求。由服务器直接连接到管理存储设备的传统存储模式已难以满足
数控测井系统是计算机技术引入测井系统的必然产物,测井软件是数控测井系统中不可缺少的重要组成部分,发挥着越来越重要的作用.随着微软视窗操作系统的普及和组件程序设计技
监控组态软件在工业控制中应用越来越广泛,对用户编程接口的支持显得日益重要。目前,这一领域的技术还不很成熟,一般组态软件只提供脚本语言,并直接对源程序解释执行,在执行效率、
IP/DWDM光网络有两种方式对数据进行路由:光路交换和分组交换.而分组交换方式工作在物理拓扑之上的以光通道构成的虚拟拓扑之上.虚拟拓扑设计是基于分组交换的IP/DWDM光网络
该文首次对一个BSP并行对象-关系数据库系统加以扩充和改造,着重进行了与图像有关处理的研究.现有的多媒体信息处理系统普遍缺乏理论基础,不能充分运用并行数据库系统的优点
随着医院信息化的深入,远程医疗已经成为社会发展、科学技术发展和医疗事业发展的必然趋势.远程医疗的实现和发展与医院信息化息息相关.从医院信息化的第一阶段——HIS阶段向
计算机网络的异构性、分布性和复杂性为网络管理,特别是网络安全管理提出了新的要求,传统的集中式的网管系统和网管技术难以满足大规模网络应用的需要。因此,需要研究新的、有效
TMN信息体系结构应用OSI系统管理的原则,引入了管理者/代理(M/A:Manager/Agent)模型.在TMN中,不同的网管代理之间的主要差别仅在于它们所管理的对象集合不同,在工作流程、响
植入起搏器患者越来越多,起搏器植入人体后需对其工作状况与电池电量进行监测,而现有的监测方法不能满足对起搏病人的有效监测。因此,本文在对起搏心电信号特点及移动无线传输技术进行分析研究的基础上,结合嵌入式技术,实现基于ARM9心脏起搏器远程无线监测终端的设计。终端采用移动无线通信进行远程数据传输,可以实现对病人实时有效的监测。在硬件部分,前端利用AD620、反相放大电路、滤波电路对信号进行处理,实现对