论文部分内容阅读
互联网凭借着其低成本、即时性、跨地域、互动性强等优势与零售业进行整合,促进了零售业态的改变。“互联网+零售”模式极大的改变了市场竞争形态,逐渐成为市场的宠儿。全国网络零售额由2005年的150亿元增至2016年的51556亿元,年均增长率高达70.04%。网络购物如今不仅成为我国普通民众的重要消费渠道之一,更已经是一种生活方式。 本文首先综述了数据挖掘、R语言及多元线性回归模型的基本理论,从经济因素、经济指数、人口因素三个方面切入,运用R语言对13个可能影响全国网络零售额的因素进行挖掘分析。然后从13个因素中的8个因素出发,对大量历史数据进行分析、归纳与整合,经过R语言的层层计算、检验和比较,最终建立了基于国内生产总值、社会消费品零售总额、网民规模、网络购物用户规模这4个自变量的多元线性回归模型。最后该模型顺利通过显著性检验、多重共线性检验、正态分布检验、同方差性检验以及独立性检验,并预测了2017年全国网络零售额。 采用理论研究和实证研究相结合的方法,借助R语言对数据进行挖掘,在多元线性回归分析的基础上建立数学模型,本文的研究成果具有一定的例举意义。同时,对于政府、学者以及零售业人员进行“互联网+零售”的数据挖掘研究及实践也具有一定的参考价值和借鉴意义。