区间数据回归分析——基于散点存在与否的分类讨论

来源 :天津大学 | 被引量 : 0次 | 上传用户:wll201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
回归分析是一种十分常见的数据分析方法,通过观测数据确定变量间的相互关系。传统回归分析以点数据为研究对象,预测结果也是点数据,而真实数据往往在一定范围内变动的。基于置信度可以形成置信区间,一定程度弥补了预测值为单点的不足,但将点数据作为研究对象,以点带表某范围内的所有数据,往往存在信息丢失的问题。区间回归分析是一种以区间数为研究对象的数据分析方法。区间数能反映出数据的变动范围,更符合现实情况。区间型符号数据是区间数的一种,通过“数据打包”形成,因此除具有区间端点信息外,还具有区间内部散点信息。  本文基于区间数有无散点,进行了分类研究。当区间数散点未知时,可以利用的信息包括区间端点、中点、半径等。当前针对特殊值的研究已取得许多成果,其中一类是以区间中点、半径来表示一个区间数的,包括中点半径法、约束中点半径法、模型M等。这些方法的不足在于,未考虑区间中点误差范围较大而区间半径相对较小的情况,本文通过添加约束条件,在中点半径法基础上加以改进。蒙特卡洛实验表明,新的约束中点半径法能在中点波动较大时,依然保证预测区间与观测区间有所重叠。最后将新的约束中点半径法应用于沪深300指数预测中。当区间数散点已知时,除了特殊值,还可以充分利用内部散点信息。现有的基于描述性统计量的回归模型(DSM)充分利用了内部散点信息,但预测时会出现区间左端点大于右端点的情况,为解决这一问题,本文对DSM模型进行改进,形成扩展的DSM模型(eDSM)。一方面对原模型增加了假设条件,为后续新的预测策略提供支持,并给出了求解公式的推导,另一方面对预测策略进行改进。预测时有两种策略,一是预测区间均值、均值到区间左右端点的距离,进而形成区间,一是预测内部散点,将散点“打包”成区间。在模型假设成立的情况下, OLS模型可用于系数估计,因而有两种系数估计方法。将系数估计方法、预测策略进行组合,共形成四种方法,通过蒙特卡洛模拟,将四种方法进行了对比,并与现有的DSM、约束中点半径法(CCRM)方法进行了比较,结果表明,在误差范围不变的情况下,当系数绝对值较大时,系数估计选用eDSM模型,预测采取预测散点的策略,效果最优,当系数绝对值较小时,系数估计选用eDSM模型,预测采取预测特殊值的策略,结果更为突出。最后将各对比方法应用于股指变动预测和淘宝店铺信用度预测中。
其他文献
该论文结合实际工作中的一些管理经验,对中国收费公路通行费价格机制进行了初步研究,对中国现行收费公路通行费车量分型和收费标准进行了修正,希望在实际应用中有一定的指导
数学是一门关于策略的学问,而思想是数学的灵魂.数学思想方法在数学知识规律的感性认识,以及本质特征的理性内化方面,具有举足轻重的指导意义.教师在教学中要深入研究挖掘教
基本不等式是高中人教A版必修五第三章第四节的内容,也是高中重要不等式之一;基本不等式是证明不等式、求函数值域的重要工具,不等式求最值也是近几年高考的热点,形式为:√ab
企业的非企业化管理和超企业化浪潮即将来临,从对纵向一体化组织的管理到项目管理,是我们正在经历、见证的革命.随着项目管理在国际、国内广泛的应用,相应的也暴露出一些治理
本文主要以德育教育在特教学校初中数学教学中的应用为重点阐述,从榜样的应用、教材内容的应用、教学活动中的应用这几方面进行深入探索与研究,其目的在于提高培智学生的综合
该文在参阅国内外大量文献的基础上,对孙子兵法的战略思想及其在现代企业战略管理中的应用,进行了系统性的理论研究.该文通过对孙子兵法的战略思想和体系的分析,明确提出孙子
第一章介绍研究背景、研究意义,简要概述相关研究现状,并概括该文结构、主要内容和创新点.第二章,当需求为已知、固定时,从个三方面对基本EOQ模型进行扩展研究:①将缺货或交
2014年,我国教育部出台了一系列关于新课程改革的文件,要求学校教育要发展学生的学科核心素养,要努力培养学生的思维品质和综合能力.如何在高中数学教学中培养学生的核心素养
数学高考压轴题最能体现数学高考的命题思想,近五年我国数学高考压轴题命题存在以下特点和趋势:数学压轴题命题风格趋向简洁明了;隐含信息增多;重视数学思想及本质.研究的思
在小学课堂教学活动中,教师应当结合学科特点与学生实际情况,科学合理的运用小组合作学习模式,并不断学习和进步,努力探索出更加有效的小组合作学习方式,引导小学生合作探索