基于数据挖掘算法的微信公众号阅读量分析

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:jimislg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络和科技的迅猛发展,各种自媒体平台不断涌现。微信公众号作为新网络时代的社交工具,以其实用的便利性和发布信息的及时性得以迅速发展。不过,随着不同功能和类别的公众号层出不穷,微信用户的注意力越来越分散,微信公众号粉丝增长越来越难,文章打开率也越来越低。在此情境下,对影响微信公众号阅读量的因素进行研究和把握,有利于公众号提高发布信息的阅读量,从而在日趋激烈的竞争中充分发挥媒体特性。通过对微信公众号阅读量的研究分析,可以帮助公众号用户找到有价值的信息,并为公众号运营者提供相应的发展方向和策略。目前,对于微信公众号阅读量分析的研究尚处于起步阶段,因此探究影响微信公众号阅读量的关键因素,掌握微信公众号的运营策略具有重要的理论意义和实用价值。本文从微信公众号运营者的角度入手,对于某公众号分析网站上的998条数据进行详细分析。以公众号某个月平均每次发文所能获得的总阅读量为因变量,选取了包括公众号类型、发文时间等14个影响阅读量的特征指标,运用了决策树回归、Adaboost、Bagging、随机森林、支持向量机、线性回归6种数据挖掘算法构建模型。通过十折交叉验证法,对每种算法模型的拟合结果进行比较,确立了基于随机森林算法建立影响总阅读量的分析模型。首先基于全部数据集运用随机森林算法建模,选出模型拟合优度最佳的指标组合,包括公众号类型、公众号类别、名称长度、头像是否彩色、日均发文次数、单次篇数、原创占比、视频占比、标题长度、标题标点指数、标题正向情感得分、信息熵共12个特征指标。然后将全部数据集划分为800个训练样本集,198个测试样本集。利用训练集数据建立随机森林模型,一方面将预测集数据带入模型进行阅读量的预测和分析,发现该模型能够对公众号的阅读量给出较为合理的解释,符合实际情况,具有实际运用价值。另一方面,运用随机森林算法建立的模型将优选出来的12个特征指标进行重要性排序,得出了单次发文篇数、日均发文次数、公众号类别、信息熵、视频占比、原创占比、标题标点指数是运营公众号的重要因素,并针对运营公众号提出了相应的策略和建议。通过本文的研究,有力地为微信公众号平台的进一步建设和优化奠定了理论基础,并且提供了实用的运营策略和方向。
其他文献
为了调查内蒙古包头市土默特右旗某养牛小区发生的奶牛乳房炎的病原菌种类及其敏感药物,对发病牛乳样进行了病原分离培养、镜检、生化鉴定、药敏试验。试验结果表明,该养牛小
直线电机不要中间转换装置就能实现直线运动。直线同步电机是一种高速度、高效率的传动机械,高速磁悬浮列车广泛采用它进行驱动。它是多变量、非线性、强耦合的系统,不像直流
政府采购在西方国家有着相当长的历史和比较完善的法律制度体系,近二十年来在我国也得到了快速发展。随着经济的发展和市场制度的日益完善,政府采购规模日益扩大,采购过程更
镁合金作为21世纪“绿色”工程金属,除具有比重小、比强度和比刚度高、导热导电性能好等特点外,还兼有良好的阻尼减震和电磁屏蔽性能,已成为现代汽车、电子、通讯等行业的首
雅托噶是蒙古族富有特色的传统弹拨乐器。在历史发展的过程中,演奏、曲目、形制等方面形成了独特的艺术品格,并根据流传地域不同,形成了不同的特色。本文以蒙古族民歌《瑙门
通过对苏州卫生职业技术学院酒店管理专业2010级、2011级、2012级三个年级的学生进行问卷调查和访谈,分析了该专业学生对专业认知的现状,提出加强专业教育、增强专业认同感,
雅托噶是蒙古族弹拨弦鸣乐器(汉族称"蒙古筝)"。以有限的文献资料考究其起源,最初形制、流变以及古瑟与汉族筝之渊源、并借助民间传说和文学作品中描述,认为,蒙古族弹拨弦乐
加强动物福利,给动物提供全价的营养饲料,在牧草枯黄期对1岁羯羊进行健康养殖育肥效果试验。结果表明,牧草枯黄期1岁羯羊放牧加补饲配合全价饲料,短期育肥60 d,试验结束时试
《魏书》有:"乐有箜篌,木槽革面而施九弦"的记载,这段文字第一次有革面九弦琴的历史记录。朝鲜族伽倻琴或是汉族筝琴是否与九弦琴有着源与流的必然联系尚须作进一步的探索,但
孕酮含量对奶牛的早期妊娠诊断有重要的意义,乳中孕酮含量大于7ng/ml时可判定为怀孕,小于4ng/ml时可判定为未孕,在两者之间时判定为可疑。本实验用放射免疫测定法来研究乳中