论文部分内容阅读
随着计算机、网络和通讯等信息技术和数据贮存技术的蓬勃发展,存储的数据越来越多。然而数据只是一个信息的载体,是“死”的,面临的主要问题是如何将“死”的数据转化为“活”的知识。数据挖掘技术可以对这些数据进行及时有效地处理,从这些海量数据中获取潜在的、有用的知识和信息。数据挖掘是数据库、人工智能、模式识别和统计分析等学科相互交叉、结合的前沿性研究领域。
本论文以广告定价依据及数据挖掘理论和技术为前提,将数据挖掘技术应用于广告定价过程中各个基础环节上,为我国电视媒体在广告价格制定中应用数据挖掘技术提供参考。主要工作由以下几个方面组成:
1、对电视台广告定价过程进行了深入的学习和研究,首先通过对国内文献的阅读,明确影响广告价格的主要因素,确定所需要的数据;然后通过对国外文献的阅读,了解电视台广告定价的运作过程以及相关领域的研究状况,明确了进行分析的核心问题——受众群体细分及建立节目受众轮廓。在获得相关数据后,对国外原有模型进行改进,提出了新的电视台广告定价系统模型。
2、对原始样本数据进行受众群体细分。首先分析了常用的k-均值算法和模糊C-均值算法在聚类效果上的不足,然后提出了一种基于修正隶属度函数的模糊C-均值算法,并对其有效性进行了分析。在此算法基础上,对受众的样本数据进行受众群体细分,找出电视台某节目的主要收视群。
3、在受众群体细分的基础上,建立节目受众轮廓。这一部分采用两种数据挖掘方法。第一种是线性回归方法,用于分析平均收视率与各特征收视率之间的关联性;第二种采用决策树的分析方法,找到依赖变量值上的最强划分。通过这两种方法的数据挖掘分析,建立了电视台某节目在黄金时段的节目受众轮廓。
4、为电视台节目安排及广告定价提供商业决策。首先采用逻辑回归的方法对电视台节目份额进行预测,得出节目类型及星期数对节目平均收视率和主要特征收视率的影响,以便于电视台安排合适类型的节目。然后采用线性回归分析,对节目收视点成本进行分析,得出各主要特征收视率与收视点成本的关系,用以计算广告的受众价值。最后综合上述所得结论,由节目受众轮廓得到最符合广告主所需目标受众的广告内容,以及对于广告主所投放广告的收视点分析。