【摘 要】
:
[目的/意义]以大数据环境下的文本情感分析这一特定任务为目的,对规模适配问题进行研究,为情报学领域研究人员进行大数据环境下数据分析时,实现效率和成本的最优选择提供借鉴
【机 构】
:
中南财经政法大学信息与安全工程学院 武汉 430073中南财经政法大学统计与数学学院 武汉 430073;武汉大学信息管理学院 武汉 430072;
论文部分内容阅读
[目的/意义]以大数据环境下的文本情感分析这一特定任务为目的,对规模适配问题进行研究,为情报学领域研究人员进行大数据环境下数据分析时,实现效率和成本的最优选择提供借鉴.[方法/过程]采用斯坦福大学Sentiment140数据集,在对传统情感分析算法分析的基础上,提出了5种面向大数据的文本情感分析算法,检验各种算法在不同环境和数据规模下的适配效果,从准确性、可扩展性和效率等方面进行实证比较研究.[结果/结论]实验结果显示,本文所搭建的集群具有良好的运行效率、正确性以及可扩展性,Spark集群在处理海量文本情感分析数据时更具有效率优势,且在数据规模越大的情况下,效率优势越明显;在资源利用方面,随着节点数和核数的增加,集群的整体运行效率变化显著,配置5个4核4G内存的从节点,能够实现在高效完成分类任务的同时达到节约资源成本的效果.
其他文献
综合档案馆作为保管政府信息的重要部门,要不断拓展自身职能,适应社会发展的需要,才能在竞争激烈的信息社会中求得更大的发展空间。政府信息公开是社会发展的必然要求,也是我国政
摘 要:随着我国旅游资源的不断开发,旅游区公路的面貌也发生了巨大的变化。因此,人们对旅游公路的景观要求也越来越高。如何考虑旅游线路的特点,最大化保护生态环境,展现出沿途美丽的风景,改善行车环境,真正实现“车在画中行”。我们的目标是实践。研究结果有助于进一步提高公路景观设计的美学价值。为同类工程提供参考和指导。 关键词:旅游;公路景观;景观设计;设计新理念 中图分类号:U418.9 文献标识码:
在网络飞速发展的今天,图书馆正在经历从对网络环境的适应发展到融合,从融合到功能调整、再到发展追求生存环境变革。这种变革导致网络图书馆模式下,对图书馆员、用户行为的跟踪
网络空间是人类生活的新型空间,应该根据现实社会中的道德规范与现有新媒体传播法律法规,明确网络传播行为规范和建构网络道德体系,强化网民的道德认知;同时,引导网民在个体
[目的/意义]基于北京师范大学图书馆由自动化集成管理系统Aleph500迁移至下一代图书馆服务平台Alma的项目实践,对迁移项目的实施难点及过程进行详细介绍,并结合已有研究成果,