基于WWW的文本数据挖掘研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:lilunyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现存的搜索技术在给人们带来便利的同时,也为用户带来了一些不必要的麻烦,体现在信息丢失、返回过多无用信息以及信息无关等几方面.造成这些问题的根据原因在于信息检索技术严重落后于Internet的发展,尤其是WWW的发展.该文在数据挖掘和信息检索技术的基础上引入了WWW的文本数据挖掘技术.除了WWW的文本数据挖掘之外,Web数据挖掘还包括其他两种:一种是Web访问信息挖掘,另一种是Web页面结构挖掘.在该文的最后指出了进一步的研究方向.
其他文献
该课题利用RS485总线标准,用软件实现FF的两种通信:周期性通信和非周期性通信.主站查询活动设备状态表,与每个到达通信时间的站点进行周期性通信.各站点之间通过传递令牌进行
该文主要内容涉及模式识别和电子商务两个领域,结合指纹识别技术、数据库技术和一定的法学理论,构造了一套将传统的合同机制应用于电子商务的操作模式,可以有效提高在线交易
在“便携式农业专家系统”项目的开发中,为了从农作物信息文本中抽取数据构造数据库,首先得从文本中为各类物种提取信息模板,形成数据库中各个表的字段定义。由于自然语言尤其是
该文详细介绍了控制台和站场操作命令处理模块的设计方法和思路;采用循环控制等方法解决信息的实时处理和实时通信问题,同时说明了信号保持模块的设计方法.该文分析了通信死
该文首先介绍了当前网络(尤其是Internet)存在的各种安全隐患,引出了各种网络安全思想和方法.然后从普适性基础的观点出发,通过对PKI相关协议研究,对PKI的定义、特点、各功能模
本文以数字城市东京和数字城市上海为背景,基于代理社会的交互式规则的几个主要问题:用户行为、代理社会的定义,计划模型、计划算法以及预谋代理等,寻求解决这些问题的方法.
本论文主要是研究利用计算机分析汉语文章。在论文中,详细介绍了计算机汉语理解的算法思路和具体实现。本文一共包括六章。 第一章主要是介绍开发本系统的背景和系统的功能
公共交通系统的智能化、信,信息化是我国城市发展战略之一,它是保证城市可持续发展的必由之路,也是推动国民经济持续、健康、稳步前进的一项重要基础设施。因此,城市公共交通自动
CTI技术是计算机技术和电信技术相结合的产物,它使计算机网络和电信网络有机的融为一体,对信息社会起到了至关重要的作用。呼叫中心作为CTI技术的典型应用,是一种集计算机语音集
最近几年,全球IP电话发展火爆.专家预测,到2000年IP Phone商业利润可达到600亿美元,再加上利用Internet传送视频、话音技术的日益发展成熟,Internet网络迅猛的发展速度几乎正