论文部分内容阅读
抽样调查的理论和方法是从实际需要中产生和发展起来的,应用于社会、经济等各个领域中,但很重要的前提是被调查者的回答必须真实。在当今社会经济等领域的统计调查中,有些调查项具有很强的敏感性。被调查者往往不如实提供资料甚至拒绝回答。诸如个人或单位是否偷税漏税及数额的多少;考生在考试中是否作弊;是否吸毒及毒品消耗的数量等等涉及个人隐私或为社会所不赞成的各种事件。出于大到社会安定团结,国民经济的良性发展,小至团体单位的直接利益等考虑,必须掌握在总体中子群体的敏感指标均值。对敏感性问题采用直接调查的方法不能获得真实的数据资料,从而不能保证调查结论的准确性可靠性,而且所获得结论与事实的出入大小也无法度量,因此必须采用特殊的调查方法。从Warner起已经有许多随机化回答模型问世[见Simmons(1969),Fox and Tracy(1986),Moors(1971),Chaudburi(1987),Kuk(1990),Mangat and Singh(1990),Singh and Singh(1993),Mangat(1994)等]。这些方法基本属于简单估计,近年来随机化调查研究不论从抽样设计还是估计量的构造开始深入到复杂调查中。主要包括Jong-Mind等人讨论了分层抽样下的属性特征随机化调查理论和方法;Shaul K等人在[26]中利用二阶连续抽样方案改进了Warner RRT;HORNG-JINH HUANG[27]中讨论了利用两个独立的子样本同时顾及敏感属性比例π和真实回答的方法;KUO-CHUNG CHANG[28]提出了属性特征敏感问题调查中利用假设检验的方法探测随机化回答是否存在不真实回答;Arijit Chaudhuri,Arnitava Saha[29]提出了不等概率抽样方案下随机化调查方法。虽然关于敏感问题调查有很多研究,但这方面研究还不全面和系统。本文由四部分组成,第一部分在收集和分析国内外相关资料的基础之上,系统地介绍了随机化调查历史和现状及要解决的问题。重点选择了五种有理论价值和实际意义的:Warner模型,Simmons模型,Mangat模型,Kuk和Eichorn,Hayre模型进行了全面地评价。进而提出了研究随机化回答技术的新思路。第二部分在考察国内外已有随机化问题研究的成果基础之上,针对随机化调查缺乏系统的理论研究,借鉴Raghunath Arnab[Randomized response techniques for complex survey designs]的方法,给出了另一种在一般的抽样设计下的估计量,并得出估计量的期望和方差估计。同时结合一些特殊的抽样设计得出相应的估计量。第三部分在上述理论分析和探讨的基础之上,重点结合Greenberg模型,引入了含辅助信息的比估计模型,得出了期望和方差。并给出数值比和最优分配的条件。数值表明所提出估计量在一定条件下可大大提高估计量的精度。最后结合工作实践和体会,对第三部分所提出的估计量作了进一步讨论。考虑了估计量的辅助信息缺失时,通过建立了比分配模型来解决数据缺失问题。随机化调查理论是抽样调查理论的一部分,其理论和方法的研究由于特殊性已成为抽样调查理论中的颇受关注的问题。将会掀开崭新的一面。但还有更多的工作需要进一步研究。