论文部分内容阅读
现存的搜索技术在给人们带来便利的同时,也为用户带来了一些不必要的麻烦,体现在信息丢失、返回过多无用信息以及信息无关等几方面.造成这些问题的根据原因在于信息检索技术严重落后于Internet的发展,尤其是WWW的发展.该文在数据挖掘和信息检索技术的基础上引入了WWW的文本数据挖掘技术.除了WWW的文本数据挖掘之外,Web数据挖掘还包括其他两种:一种是Web访问信息挖掘,另一种是Web页面结构挖掘.在该文的最后指出了进一步的研究方向.