基于蚁群算法的WEB日志用户兴趣路径研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户：hakbin

【摘要】

：

随着信息技术的高速发展,互联网信息呈指数级增长,各类网站如雨后春笋一般活跃在我们的生活中。对于网络服务提供商而言,如何在海量的服务器日志文件中挖掘出用户的兴趣模式,

【作者】

：

黄龙伟

【机构】

：

江西师范大学

【出处】

：

江西师范大学

【发表日期】

：

2015年期

【关键词】

：

web日志挖掘蚁群算法用户兴趣路径

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的高速发展,互联网信息呈指数级增长,各类网站如雨后春笋一般活跃在我们的生活中。对于网络服务提供商而言,如何在海量的服务器日志文件中挖掘出用户的兴趣模式,已经成为许多公司的研究热点。利用蚁群算法对web用户群体的访问数据进行挖掘时,把web用户看成是人工的蚂蚁,算法模型展示的蚂蚁偏好路径,就是用户的兴趣路径,根据web用户的兴趣路径,可以适应不同客户需求,优化网站拓扑结构,改善系统运行效率,调整相应营销策略,提高决策的科学性,从而为企业创造更大的商业价值。实践与分析表明,优化的蚁群算法挖掘web用户兴趣路径相比于MF等传统算法具有更高的准确率,在web日志数据挖掘领域有更好的推广应用价值。本文的研究基于蚁群算法的web日志用户兴趣路径展开,主要工作如下:(1)利用web用户兴趣路径与蚁群觅食行为的相似性,提出了“浏览兴趣度”的新概念,用于反应web用户访问站点的兴趣程度,并使用浏览兴趣度给出了基于蚁群算法的web日志用户兴趣路径挖掘方法。即通过对信息素进行全局更新,计算转移概率,设置转移概率阈值等步骤最终得到用户兴趣路径。实验表明该方法是可行的,能够准确反应用户兴趣路径。(2)通过对客户端日志数据的预处理,从日志数据中获取鼠标滚动相对次数、用户相对浏览时间以及页面点击率等能够反映用户兴趣的关键信息。其中鼠标滚动相对次数表示用户浏览web网页时的鼠标滚动次数占所有页面鼠标滚动次数的比例,用户相对浏览时间是指页面总的浏览时间占所有页面平均访问时间的比例,页面点击率表示页面访问的次数占所有页面访问次数的比例,实验表明,三者构成的信息素能够更准确地代表用户对该站点的兴趣度。(3)蚁群算法中?、?决定了信息素浓度和意向偏爱度的影响程度,本文重新定义了?、?,通过?、?的自适应调节对启发函数进行调整,新定义不仅可以加速算法的收敛速度,而且可以避免局部收敛和早熟,实验证明,该方法提高了算法的搜索效率。

其他文献

政府投资项目代建制运行环境研究

代建制是我国政府投资项目管理方式的一次重大的改革，代建制推行的好坏直接影响着我国政府投资项目的管理效率和效果。本文在参考大量文献和分析我国政府投资项目的改革历程的

学位

政府投资项目代建制内部环境外部环境代建单位制度变迁

双资源多目标调度模型及其算法研究

生产调度是企业生产管理的关键环节。经典生产调度模型中,部分研究模型虽同时考虑了机器设备和操作工人,但通常将二者视为无关联的相互独立的资源；在当前单件小批量生产方式下大量存在不同工人操作同一设备的效率不同以及同一工人操作不同设备的操作效率不同的现象,即存在差异性工人操作效率；此外,传统计划的制定往往以静态的生产状态为基础,而不考虑实际调度过程中出现的变化,这将导致计划与调度的严重脱节,也未曾考虑自身

学位

双资源调度多目标操作效率协作计划集成模型

“出走”还是“留下” ——试论巴金《家》中觉新的艰难抉择

觉新是巴金《家》中塑造非常成功的典型人物形象,在五四新文化运动时期,“觉新”式的青年十分典型,他接受了新思想的洗礼,向往着民主和平等,但在封建文化禁锢下,他自觉承担起

期刊

时代身份性格艰难抉择

行业协会在我国技术标准研究中的地位和作用

标准化工作是实现经济结构战略性调整的基础工作，是实现科技创新和产业升级的技术支撑，更是我国应对贸易技术壁垒的重要手段。本文研究的目标和重点是行业协会在我国技术标

学位

技术标准行业协会示范基地经济效益标准化工作科技创新产业升级

基于蚁群算法的WEB日志用户兴趣路径研究

其他学术论文