基于LDA主题模型的评论热点挖掘与手机产品性能分析

被引量 : 0次 | 上传用户:sf45df
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分割作为一种文本数据的预处理技术,在信息提取、文本挖掘、文本数据分析等领域都起着极其重要的作用。基于LDA模型的文本分割技术是利用MCMC中的Gibbs抽样进行推理,从而间接计算模型参数,最终获取文本在固定主题上的概率分布。本文基于LDA模型对手机用户评论实现了主题分割,并利用主题分割结果对手机进行了产品剖析。实验结果表明,基于LDA主题模型的文本分割,能够高效的实现对文本主题的自动分类,且主题对文本的覆盖率高,模型的最佳F值为0.84,总体准确率为89.51%,平均召回率为70.15%。在此基础上,结合手机数据对不同品牌手机进行了产品性能分析,并提出了产品改进建议。
其他文献
每个电视品牌都有自己的生命周期,无外乎初创、成长、成熟、衰退四个主要阶段,而延伸策略是延长电视品牌"寿命"的必修课。《百家讲坛》的热播及其相关书籍和音像制品的畅销,
为研究开发具有应用价值的新型微生物资源,用邻硝基苯酚β-D-半乳糖苷(ONPG)法,从雪莲菌发酵乳中分离到一株产乳糖酶的酵母菌株XL-B36,通过分子鉴定,确定该菌为马克斯克鲁维酵
目的:分析肺部超声评估重症肺炎严重程度的作用以及预后临床价值。方法:择取2017年5月—2018年6月我院重症学科收治的重症肺炎患者47例,其中存活30例,死亡17例。针对患者入院
本研究采用了定性与定量相结合的混合研究方法,选取重庆邮电大学BBS为个案研究对象,探讨高校BBS学校公共事务讨论的自由平等程度,对学校公共事务决策的影响以及对使用者公共
娱乐新闻的恶意炒作、无中生有、享乐主义、金钱至上、不择手段追逐成名等低俗化现象,已与有偿新闻、虚假报道、不良广告一道,被公众列为中国传媒业的"四大公害"。当前,娱乐
去年3月16日,山东省菏泽地区东明县在全国率先开通了“148”法律服务专用电话。这个新事物一出现,立即引起司法部的高度重视。经研究,司法部党组决定在全国大力推广东明经验。截至今年
"内外有别"是我国对外宣传和传播的原则之一。它的核心内容在于对外传播受众的差异性和传播信息的针对性。历史上,它曾对党和国家的对外传播工作起到过积极作用。当时实行这
历经20多年的发展,我国县级电视台从无到有,从小到大,基本上成为所在区域中有影响、有实力的骨干媒体之一,承担县域新闻宣传和文化传播以及信息传导等重要任务,随着传媒体制
墨西哥剪纸是世界剪纸艺术大家族中少数既有本土文化传统,又富于民族特色的民间艺术之一。它孕育于古老的印第安文化摇篮。在形成和发展的过程中,又受到诸多外来文化的影响,
分析了墨西哥所具备的矿业投资优势,介绍了墨西哥的矿产资源概况,指出了在墨西哥进行矿业开发应注意的问题,最后就中资公司在墨西哥进行矿业投资提出了一些建议。