随着国内定量研究方法的开展和大型调查数据的免费公布,研究者不仅使用抽样调查数据对总体分析,还需要对域总体进行分析。本文对调查数据满足域精度推断的域估计问题进行研究。首先,根据实际调查中的域估计问题,指出解决域估计问题最好的方法是事先确定好需要估计的域,并在抽样设计时兼顾域的估计精度。但是,在实际调查中还包含计划外的域,通过对简单随机抽样下的域估计问题的研究,说明非计划域的估计问题的最大难点是域样本量的随机性。然后,针对实际中的抽样调查数据多来源于分层、多阶段、整群和不等概率等复杂抽样设计的问题,指出需要结合复杂抽样设计信息、域样本量的随机性、域样本在总体的误差层和误差群中的分布,对复杂抽样设计下的域估计问题进行研究。最后,以中国家庭追踪调查(China Family Panel Studies,CFPS)为例,对复杂抽样设计下的域估计问题进行案例研究。
随着社会经济的发展,人们越来越多地使用调查数据,尤其是利用复杂调查数据进行研究。复杂调查数据源于复杂抽样设计,是指在抽样调查过程中使用分层、多阶段、整群和不等概率等复杂抽样设计获得调查数据。在数据分析中,若忽视层、群等抽样设计的复杂性,直接利用调查数据按照传统数据分析方法,容易得出错误的结论,尤其是涉及标准误的估计。本文主要介绍复杂抽样设计和复杂调查数据的特征,对抽样信息在复杂抽样数据中的应用进行研究,并以中国家庭追踪调查(China Family Panel Studies,CFPS)为例详细说明抽样信息在复杂调查中的应用,说明在复杂抽样调查数据中使用抽样信息的重要性。