互联网视频用户观看行为分析及应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wwwdps1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网带宽的优化,网络传输、视频压缩等技术的创新,视频已成为互联网最为重要的应用之一,是互联网流量主要贡献者。互联网视频访问模型不仅是视频分发缓存策略与系统设计实现的重要依据,也是内容推荐与营销的基础。因此,分析互联网视频用户观看行为具有重要的应用价值。  本文基于互联网视频提供商PPTV、华数TV用户访问日志,分别从访问方式对用户行为的影响、视频流行度特征、语义级别用户兴趣三个方面分析视频用户行为特征。论文的主要工作与贡献如下:  1)比较分析不同访问方式下用户观看行为的差异,并提出基于访问方式感知的缓存设计方案。内容提供商通常为用户提供三种访问方式:网页浏览器(Web),PC客户端(Client),移动客户端(Mobile)。通过对PPTV大约2600万条访问日志的分析,发现Web平台下流行内容相比其他两个平台更集中。而移动客户端用户兴趣的地域相似性更高。另外,独立用户行为也呈现不同的分布,例如移动用户对长视频的观看完成率很少达到50%。最后提出基于访问方式感知的缓存方案,利用PPTV日志数据进行实验仿真,缓存命中率平均提高3-4%,缓存替换操作次数平均降低超过40%。  2)刻画视频流行度随时间演变的模式特征,分析其影响因素。通过对PPTV视频流行度长期的分析,发现不同访问方式下视频流行度呈现不同的演变趋势:Web接入方式下的视频流行度趋势变化较慢并且动态变化较为平缓。同时,视频流行度演变趋势也依赖于视频的内容类型,例如娱乐视频在发布初期往往会获得较高的流行度,而电影电视剧需要更长的时间。另外,在Web浏览器和Mobile客户端平台中视频早期观看来源与流行度演变模式有很大的相关性。这些发现为视频流行度的预测、视频推荐提供了依据。  3)挖掘用户语义级别的兴趣特征,提出基于语义兴趣的用户分类方法。通过分析华数TV长达六个月的用户访问日志,挖掘大规模视频集中隐含的语义特征。针对视频名称无法全面体现其主题的问题,为视频集增加语义描述文档,利用LDA主题模型提取视频集隐含的语义相关性,计算用户语义兴趣特征,提出基于语义兴趣的用户分类方法,并用华数TV的数据集验证了分类的可行性以及准确性。
其他文献
学位
高等院校加快信息化建设步伐的手段,主要是通过各种方式引进大量电子资源,提供丰富资料。由于某些限制,许多资源只能通过授权后校内网的IP地址访问,随着校外对资源的需求日益
随着软件开发技术的发展,软件建模已经成为其中的一个重要的组成部分,而软件建模需要软件建模工具的支持。当前,软件建模工具的功能在不断的变化发展;同时,软件应用的领域也
互联网正在快速地发展,面对信息的海洋,如何从中发现、选择和查询所需要的数据和服务信息就成为一项重要而迫切的研究课题。为了适应这种需求,提出了“语义Web”和”Web服务”的
关系网络是人或其它对象通过相互联系和影响构成的结构或系统,通过对关系网络的研究,有助于发现仅依靠个体信息无法获得的重要信息。关系网络中节点价值计算是对关系网络中的对
安全策略模型是开发安全操作系统的基础,它对安全策略的描述准确与否,决定着所开发的系统安全机制是否能正确地实施安全策略。因此,安全模型的研究对于安全操作系统的开发具有重
学位
视景仿真系统广泛应用于各个研究领域,如军事科学仿真、空间任务仿真、城市规划等等。近年来,随着我国空间科学事业的迅速发展,基于空间任务的视景技术显得越来越重要,利用视
对流体现象的仿真模拟是计算机图形学中的一个重要研究方向,在许多领域尤其是电影、游戏中有着广泛的应用。在这些应用中,除绘制出具真实感的流体动画外,有时还需要以艺术化的手
软件复用是解决软件危机的一条切实可行的途径,软件构件库是软件复用的支持设施之一。构件库主要提供构件描述、分类、发布、存储、检索、反馈和评估等构件管理作用。当前,随着
性能分析与优化一直是计算机研究中的热点.著名的80-20原理告诉我们,程序中执行最为频繁的通常只是小部分被称为热点的代码.性能分析与优化的目的就是分析发现程序热点并使之