论文部分内容阅读
近年来,随着网络和科技的迅猛发展,各种自媒体平台不断涌现。微信公众号作为新网络时代的社交工具,以其实用的便利性和发布信息的及时性得以迅速发展。不过,随着不同功能和类别的公众号层出不穷,微信用户的注意力越来越分散,微信公众号粉丝增长越来越难,文章打开率也越来越低。在此情境下,对影响微信公众号阅读量的因素进行研究和把握,有利于公众号提高发布信息的阅读量,从而在日趋激烈的竞争中充分发挥媒体特性。通过对微信公众号阅读量的研究分析,可以帮助公众号用户找到有价值的信息,并为公众号运营者提供相应的发展方向和策略。目前,对于微信公众号阅读量分析的研究尚处于起步阶段,因此探究影响微信公众号阅读量的关键因素,掌握微信公众号的运营策略具有重要的理论意义和实用价值。本文从微信公众号运营者的角度入手,对于某公众号分析网站上的998条数据进行详细分析。以公众号某个月平均每次发文所能获得的总阅读量为因变量,选取了包括公众号类型、发文时间等14个影响阅读量的特征指标,运用了决策树回归、Adaboost、Bagging、随机森林、支持向量机、线性回归6种数据挖掘算法构建模型。通过十折交叉验证法,对每种算法模型的拟合结果进行比较,确立了基于随机森林算法建立影响总阅读量的分析模型。首先基于全部数据集运用随机森林算法建模,选出模型拟合优度最佳的指标组合,包括公众号类型、公众号类别、名称长度、头像是否彩色、日均发文次数、单次篇数、原创占比、视频占比、标题长度、标题标点指数、标题正向情感得分、信息熵共12个特征指标。然后将全部数据集划分为800个训练样本集,198个测试样本集。利用训练集数据建立随机森林模型,一方面将预测集数据带入模型进行阅读量的预测和分析,发现该模型能够对公众号的阅读量给出较为合理的解释,符合实际情况,具有实际运用价值。另一方面,运用随机森林算法建立的模型将优选出来的12个特征指标进行重要性排序,得出了单次发文篇数、日均发文次数、公众号类别、信息熵、视频占比、原创占比、标题标点指数是运营公众号的重要因素,并针对运营公众号提出了相应的策略和建议。通过本文的研究,有力地为微信公众号平台的进一步建设和优化奠定了理论基础,并且提供了实用的运营策略和方向。