论文部分内容阅读
当前网络信息的增长速度让人瞠目结舌,海量的数据信息让每一位网络用户无所适从。针对目前这种大数据信息的网络现状,数据挖掘技术应运而生。本文提出了在网站上运用数据挖掘技术获取到网络用户的浏览模式等知识,并使用这些规则、知识有目的性的提升网站使用效率和亲和度。本文的主要内容:首先,文章阐述了数据挖掘,并对数据挖掘技术中的日志挖掘进行了介绍和分析,着重的分析和研究了数据挖掘过程中的数据预处理操作。第二,本文通过在传统的关联规则算法的基础上做了改进,主要的思路是:针对相对较低的运行效率,通过减少关联规则算法对频繁、冗余的对数据源扫描,以此提高运行效率。第三,文章研究了常用的数据挖掘算法、最大向前引用算法、会话识别以及EM聚类算法等。这些算法的运用能帮助我们跟好、更快捷的获取我们所可能关心和需要的信息内容,极大的提高了在海量的数据中提取我们需要的知识效率。第四,在上述算法和技术的基础上,本文对自适应网站进行深入研究,将数据挖掘技术和自适应网站系统结合起来,尝试制作了自适应网站系统的基本框架结构。同时针对自适应网站系统的存在的一般性不足,给出了一些改进意见和建议。第五,本文提出了Cookies技术和Session相组合的方式,解决了识别用户困难和不准确的问题;此外,让自适应网站自动的为浏览用户提供动态链接,提高网站的个性化服务能力和友好度。第六,论文对上述的数据挖掘算法、自适应系统和网站的性能进行了总结分析。最后,文章总结论文的主要研究的内容,对目前自适应网站存在的问题提出了观点和建议。综上所述,本文通过数据挖掘技术、关联规则算法以及一些Web技术的方式,从海量的数据中提炼人们所需要和关心的知识或规则,通过结合数据挖掘技术的自适应网站本身的特性将辅助用户决策。因此,网站结合数据挖掘技术将是未来的一个热门研究领域。