论文部分内容阅读
随着互联网飞速发展,微博等社交平台的用户规模与日俱增,每天都会产生大量信息资源和客户资源。于是很多商户借助微博平台营销,传统的方式是主动宣传产品等待用户发现,往往广告成本高昂。本文提出一种基于微博关键词的辅助营销系统,根据用户发布的微博内容挖掘潜在客户,辅助商家营销。该系统主要包括用户个人信息管理、微博数据采集、微博数据分析、博主信息跟踪和管理员模块。个人信息管理模块实现用户注册登录、信息修改以及权限申请等功能,系统通过验证用户账号有效性防止游客进入系统。由于在微博数据采集过程中对服务器端的网络资源以及计算资源消耗较大,针对不同权限用户所能获取的数据量进行一定限制,用户通过申请更高权限以获取更多数据。微博数据采集根据用户提供的关键词、时间段、地点等信息,通过网络爬虫抓取所给时间地点范围内,人们在微博平台发布的包含关键词的博文数据以及博文对应的博主数据,比如博文内容、发布时间、博主链接等。微博数据分析的目的是从采集到的原始数据中筛选出价值较高的数据,主要包括博主数据分析和博文内容分析。博主数据分析根据真实用户和虚假用户在基本信息、微博内容以及社交关系等方面的差异,采用一种多维特征检测方法识别出虚假用户并过滤,准确率达到83%。博文内容分析包括博文情感分析和博文价值评估,其中情感分析基于情感词典的方法计算博文的情感值并判定情感倾向偏向正面、中性或者负面,博文价值根据关键词在博文中出现的频率和博文的人气值等因素综合计算,最后优先展示情感倾向偏向正面、价值较高的博文内容。博主信息跟踪部分用户可以根据展示的博文信息,关注有价值的博主并查看博主详细资料,通过调用微博数据采集模块获取博主最新动态,并调用微博数据分析模块返回博主最近微博内容的关键词以及情感倾向等信息。管理员模块主要负责微博账号管理和用户账号管理。微博账号主要用于模拟登陆,因为微博平台的数据访问限制,在数据采集模块中只有登录成功后才能获取更多博文数据。基于微博关键词的辅助营销系统,能够从海量微博数据中挖掘出相对有价值的博文信息,方便商家进一步筛选出潜在的客户,系统还会跟踪博主的最新动态,对于商家营销有一定的帮助。