基于蚁群算法的WEB日志用户兴趣路径研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:hakbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,互联网信息呈指数级增长,各类网站如雨后春笋一般活跃在我们的生活中。对于网络服务提供商而言,如何在海量的服务器日志文件中挖掘出用户的兴趣模式,已经成为许多公司的研究热点。利用蚁群算法对web用户群体的访问数据进行挖掘时,把web用户看成是人工的蚂蚁,算法模型展示的蚂蚁偏好路径,就是用户的兴趣路径,根据web用户的兴趣路径,可以适应不同客户需求,优化网站拓扑结构,改善系统运行效率,调整相应营销策略,提高决策的科学性,从而为企业创造更大的商业价值。实践与分析表明,优化的蚁群算法挖掘web用户兴趣路径相比于MF等传统算法具有更高的准确率,在web日志数据挖掘领域有更好的推广应用价值。本文的研究基于蚁群算法的web日志用户兴趣路径展开,主要工作如下:(1)利用web用户兴趣路径与蚁群觅食行为的相似性,提出了“浏览兴趣度”的新概念,用于反应web用户访问站点的兴趣程度,并使用浏览兴趣度给出了基于蚁群算法的web日志用户兴趣路径挖掘方法。即通过对信息素进行全局更新,计算转移概率,设置转移概率阈值等步骤最终得到用户兴趣路径。实验表明该方法是可行的,能够准确反应用户兴趣路径。(2)通过对客户端日志数据的预处理,从日志数据中获取鼠标滚动相对次数、用户相对浏览时间以及页面点击率等能够反映用户兴趣的关键信息。其中鼠标滚动相对次数表示用户浏览web网页时的鼠标滚动次数占所有页面鼠标滚动次数的比例,用户相对浏览时间是指页面总的浏览时间占所有页面平均访问时间的比例,页面点击率表示页面访问的次数占所有页面访问次数的比例,实验表明,三者构成的信息素能够更准确地代表用户对该站点的兴趣度。(3)蚁群算法中?、?决定了信息素浓度和意向偏爱度的影响程度,本文重新定义了?、?,通过?、?的自适应调节对启发函数进行调整,新定义不仅可以加速算法的收敛速度,而且可以避免局部收敛和早熟,实验证明,该方法提高了算法的搜索效率。
其他文献
代建制是我国政府投资项目管理方式的一次重大的改革,代建制推行的好坏直接影响着我国政府投资项目的管理效率和效果。本文在参考大量文献和分析我国政府投资项目的改革历程的
生产调度是企业生产管理的关键环节。经典生产调度模型中,部分研究模型虽同时考虑了机器设备和操作工人,但通常将二者视为无关联的相互独立的资源;在当前单件小批量生产方式下大量存在不同工人操作同一设备的效率不同以及同一工人操作不同设备的操作效率不同的现象,即存在差异性工人操作效率;此外,传统计划的制定往往以静态的生产状态为基础,而不考虑实际调度过程中出现的变化,这将导致计划与调度的严重脱节,也未曾考虑自身
觉新是巴金《家》中塑造非常成功的典型人物形象,在五四新文化运动时期,“觉新”式的青年十分典型,他接受了新思想的洗礼,向往着民主和平等,但在封建文化禁锢下,他自觉承担起
标准化工作是实现经济结构战略性调整的基础工作,是实现科技创新和产业升级的技术支撑,更是我国应对贸易技术壁垒的重要手段。 本文研究的目标和重点是行业协会在我国技术标