基于Python的新浪微博用户数据获取技术

来源 :电子世界 | 被引量 : 0次 | 上传用户:sn00426
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了获取用于社交网络研究的新浪微博用户数据,本文改进了传统网络爬虫,设计了一个基于Python的新浪微博爬虫系统。该系统使用scrapy多线程爬虫框架,实现了模拟登陆、动态网页抓取和克服微博反爬虫机制等功能,抓取后数据被存储在My SQL数据库中,便于后续分析。实验结果表明,该爬虫系统获取数据的实行性和效率高,稳定性和准确性较好。
其他文献
通过对福建省15所本科普通高校体育课程设置的调查,分析总结了目前福建省本科普通高校公共体育课程设置的内容、门类、学时以及考核评价等现状,并在此基础上提出了丰富体育课程
大学生就业事关家庭、高校、社会和国家的发展与稳定,做好大学生就业工作是构建社会主义和谐社会的重要组成部分。当前,大学生就业工作中还存在着毕业生供求存在局部性、结构性
随着社会正式迈入4G网络时代之后,4G技术在广播电视行业之中得到广泛的应用,并且其打破了环境、时间与地点的限制,其拥有非常明显的优势。因此,本文在分析4G技术特征的基础上
智能家居的发展优化了现代家庭的传统生活方式。基于Arduino设计和制作的家居机器人,在控制端(如手机)与受控对象(如家居机器人)之间采用无线通信方式,具有远程遥控功能,能够
需求分析是科学地设置课程不可缺少的一个步骤,是西方教育中学前培训的一项重要活动.在中国高校中这项工作尚未受到足够的重视。以大学英语为例,针对教师“边调查,边教学”,即在课