【摘 要】
:
大数据时代的来临,为我们提供了新的数据渠道,为我们创新调查方式,更快捷、高效、科学地获取用户满意度提供了一种可能。但受网络信息巨量,用户评判标准不一等因素的制约,仅
论文部分内容阅读
大数据时代的来临,为我们提供了新的数据渠道,为我们创新调查方式,更快捷、高效、科学地获取用户满意度提供了一种可能。但受网络信息巨量,用户评判标准不一等因素的制约,仅仅通过人工分析已无法满足分析需求。本课题将尝试以上海迪斯尼景区的网络评价数据为例,在完成网络数据爬取、基于隐马尔可夫(HMM)模型的中文分词、向量空间(VSM)模型将文本转向量等一系列数据源和数据预处理工作后,通过机器学习中的多层感知器(MLP)神经网络进行建模,并构建主题模型。课题研究成果主要有三个方面:第一,综合运用HMM分词模型、VSM模型、MLP神经网络以及LDA主题模型,创新了用户满意度调查方式;第二,通过模型的构建,实现了将定性评价转为定量评估,提高文本数据的挖掘分析能力;第三,通过主题模型加深对内部维度结构的认知,更加细化对文本数据的挖掘。本课题成果的实践价值主要体现在三个方面:一是突破传统调查局限性,实现调查时间和空间上客观辩证统一;二是以大数据"数据导向"方式与问卷调研"立论导向"方式相结合,成为传统统计调查的有益补充和替代;三是研究成果可以在各领域调查和研究中复制推广,实践应用性较强。
其他文献
<正>去年底召开的中央经济工作会议再次提化解房地产库存,这是继去年11月10日习近平主席在中央财经领导小组会议讲话中第一次提出要化解房地产库存、12月14日中央政治局经济
现今许多企业为了提高竞争能力正在开发适合本企业的管理信息系统,但是由于管理信息系统的开发不但涉及到软件开发方面的知识,还需要借助管理方面的经验,然而这些高技术、专
基于电荷放大原理提出了一种新型的用于电容传感器的微弱电容测量电路。该电路具有较强的抗杂散电容性能 ;较好的解决了电子开关的电荷注入效应对测量分辨率的影响问题 ;该电
以猪肩胛骨为原料,用蛋白酶将其水解用以制备降血压肽。以酶解液的血管紧张素转化酶(ACE)抑制率为主要指标,筛选出风味蛋白酶为最适的蛋白酶进行酶解优化实验。考察酶解时间
"碗舞"作为曲靖师宗地区壮族先民流传下来的一支具有代表性的重要舞蹈,且成为至今一直在民间活太传承着的非物质文化遗产。本文通过以师宗地区的民间"碗舞"为例,在对师宗民间
<正>首尔是从朝鲜战争的废墟中成为当今最欣欣向荣的城市之一。1392年在朝鲜王朝时期首尔成为了首都,当时首尔是按照最基本的城市设计来建造的。后来在殖民地时期首尔就变的
目的使用中国家庭追踪调查数据探究中国母乳喂养与儿童体质指数(BMI)、超重及肥胖关系,判定母乳喂养能否预防儿童肥胖,为制订儿童肥胖防治策略提供科学依据。方法收集2 388名
本文希望通过对We Chat的研究,以科技接受模式、创新扩散理论为基础,针对影响使用者与潜在使用者移动即时通讯软件的使用因素进行探讨,结论如下:由于移动即时通讯软件的使用
偶然读到一篇文章,讲的是蚂蚁。蚂蚁家庭和和睦睦,忙忙碌碌,蚁后生儿,公蚁持家,在我们从没看在眼里、放在心头的田野、荒滩上搬运食物.建设家园,繁衍生息。想不到小小生灵真活得如此