【摘 要】
:
Web信息资源的获取是基于Internet数据挖掘中的一种重要技术。本文阐述了基于WWW的Web资源获取系统的主要特点,分别从体系结构和技术实现方面对有关的问题进行了较系统的分析,
论文部分内容阅读
Web信息资源的获取是基于Internet数据挖掘中的一种重要技术。本文阐述了基于WWW的Web资源获取系统的主要特点,分别从体系结构和技术实现方面对有关的问题进行了较系统的分析,介绍了在WWW上进行信息获取所采用的算法和策略并提出了目标文本的模糊空间模型(FVSM)概念,并介绍了在此基础上采用改进的启发式Robot技术建立的WRAS(Web Resources AcquisitionSystem)信息资源获取原型系统的设计与实现方法。
其他文献
CSCW(计算机支持的协同工作)是一个新的多媒体应用领域.该文介绍了CSCW的概念,分类,形成与发展及其关键技术.在此基础上,我们分析了共享对象请求代理体系结构CORBA的基本思想,
随着“数字地球”和“全球信息网格”概念的相继提出,建立全球化的,具有多分辨率结构、海量数据的大规模虚拟地形场景受到人们越来越多的重视。如何构造一个全球化的多分辨率
该文根据国内外软件复用技术的发展状况,结合构件式软件利用的基础理论和技术,对基于构件的软件利用技术进行了深入研究.主要内容包括:1、对国内外软件利用技术的发展现状进
故障管理的有效与否和功能强弱直接关系到被管理网络的可用性和可靠性。故障检测阶段的目的是在故障发生以后,尽可能地将其识别出来;检测出的异常事件经过过滤,将进入故障定位处
该文作者经过辛勤研究,在以下几个方面取得了一些成绩,通过实例分析和比较,显示我们方法的可行性和其中某些技术具有一定的领先性:1)发现了密码协议中消息关联特征,并能抽取
该文作了以下研究工作:对现有的数据包调度算法就归一化服务公平系数、响应延时、算法复杂度和资源利用率进行了综合评价.运用具有零响应的通用流调度算法的设计思想,提出最
可扩展标记语言(Extensible Markup Language,简称XML)作为新一代Internet通用信息格式正在蓬勃发展之中,它的出现引起了Internet的新一轮发展。但是,我们可以看到大量的数据存储
该文全面介绍了TTS的发展过程、基本原理、以及多级TTS理论的基本组成.据此提出了一种网络信息阅读系统的设计方案.多级内码理论是一种新型的汉字处理理论,其独特的优点使其
该文对密码学中的加密、数字答名、身份认证等基本机制,进行了详细阐述,并围绕提高密钥的安全性这个问题,研究了秘密共享方案,分析了一些典型的门限签名方案,在研究了预动安
该课题结合国家自然科学基金和教育部重点实验室访问学者基金资助项目(振动台模型实验),根据结构工程领域及结构分析软件(有限元分析软件)的特点,研究了利用先进计算机技术,