【#第一文档网# 导语】以下是®第一文档网的小编为您整理的《普查事后调查理论及其中国实践研究(78)》,欢迎阅读!
普查事后调查理论及其中国实践研究
金勇进 陶 然
(中国人民大学应用统计科学研究中心,中国人民大学统计学院,)
作为一种全面调查,普查主要受到各种非抽样误差的影响,总的误差效应表现为普查准确性,即普查结果与真实值的偏差。事后调查是普查数据质量众多评估方法之一,通过在普查的某些环节结束后开展独立的抽样调查,将抽查数据与普查数据对比,因此也被称为事后抽查;其目的一是要分析普查汇总结果的各种误差影响因素,发挥对普查数据质量的预防控制作用;二是实现对普查总体的推断,用以评估普查汇总结果的准确性。
一、普查事后调查技术方法
为了达到上述两个目的,普查事后调查可以采用两种技术方法,一种是以事后抽查为准衡量普查对象的普查记录,根据抽样设计推断普查总体净误差,本文称为净误差推断。假设事后抽查第i个样本普查小区第j个普查对象的普查结果是Eij,认为普查真实值只是理论存在,而将该普查对象的事后抽查调查结果Pij视为普查真实值的替代,用EijPij表示该普查对象的调查误差,该样本小区全部普查对象的误差汇总即可得到样本小区的净误差EiPi,再结合事后抽查设计得到普查总体净误差EP。通过净误差推断可实现普查和多种误差的识别,若将普查结果Eij视为普查对象的计数,净误差推断可用来检查普查涵盖情况;若将Eij视为普查对象的指标值,则又可用来检查普查回答或计量误差。由于净误差推断建立在以事后抽查记录为准的匹配基础上,因此其可以用来对普查对象的调查质量进行过程检查,及时发现普查中存在的问题;或者将样本普查小区内普查对象的检查结果根据属性进行分类,根据不同属性的误差发生情况控制普查的过程质量;或者根据汇总推断普查总体,对普查总体数据准确性做出评估。
另一种是通过普查对象的事后抽查数据与普查对比,结合捕获再捕获模型原理推断普查总体,本文称为双系统估计。此时,仍假设样本小区内普查对象的普查结果Eij和事后抽查结果Pij对比,但不考虑真值的存在性,也不计算普查对象的匹配误差;而是将Eij和Pij视为普查对象在普查和事后抽查两个独立系统内的连接属性,且要求所有普查对象在同一系统内的连接属性是相同的。为此需要采取措施满足上述条件,考虑将事后抽查在普查登记结束一定时间后开展,满足两次独立假设;将样本单元进行事后分层,使得每一事后层内普查对象具体有较高的同质性满足等可能连接的属性;在每一事后层构造子总体的双系统估计,最终将事后层估计结合抽样设计合成普查总体估计,以此计算与原有普查结果的偏差,用以评估普查的准确性。由于双系统估计不对事后抽查相比普查的准确性程度做出假定,因此其对比结果不能用来衡量普查的过程误差,但可以衡量事后层子总体的普查结果偏差,或最终总普查总体的普查结果偏差。 二、普查事后调查技术的适用性
净误差推断方法将普查对象的事后抽查结果视为真实值的替代,其实质是假设普查对象仅在普查中发生调查误差,而以事后抽查为准。为了满足这一假设,实践中,可在事后抽查中采用经验丰富的调查员,采用细致的调查方案在一定范围内开展,例如仅用于评定所抽中的样本普查小区;同时进对误差发生机率较小的普查对象进行检查,例如人口普查和农业普查中的住户单位,经济普查中的法人单位,这些普查对象由于具有固定的住所或者登记注册地,因此在完善的事后调查中能够避免误差的再次发生。其次,净误差推断不仅用于普查总体的净误差评估,也适用于普查总体的分类误差控制,例如在人口普查和农业普查中对同一样本小区家庭住户根据不同属性
*
*
中国人民大学研究生科学研究基金“经济普查数据质量评估与控制研究”项目资助(项目编号:10XNG049) 金勇进,男,北京市人,教授,博士生导师,研究方向:抽样调查技术、数据处理与分析。 陶然(1982-),男,河南汝南人,博士生,研究方向:抽样调查技术、统计数据质量。
分类误差,适时的对特定普查对象采取质量控制措施;最后,如果用于推断总体净误差,推断将完全建立在抽样设计的基础上,简便易行。
双系统估计理论不对事后抽查做出真值假定,即认为普查对象可能在两次调查中同时发生调查误差。这点相比净误差推断,能对普查对象的调查误差做出更为准确的评估,适用于存在特定误差现象的普查对象,例如人口普查中的人由于较大的流动性,很容易被普查或是事后抽查遗漏,经济普查中的无证个体经营户也容易被等忽略。其次,为了满足两次调查独立的假设,事后抽查通常在普查结束一定时间后开展,但这将导致事后调查不能对普查过程进行质量控制;最后,采用双系统估计时对样本单元进行细致的事后分层才能满足同一调查中等概率连接的假设,需要较大的样本量用以满足每个事后层都有足够的样本量用于子总体的双系统估计,因此费用较高,实施相对复杂。尽管双系统估计在国外由最初的人口普查应用扩展到农业和经济普查,但围绕其前提假设的争论一直不断,各国也在寻求方法的改进与突破。
三、对我国普查事后调查的实践探讨
中国周期性普查制度在2003调整后由人口普查、经济普查、农业普查组成,1982年人口普查中开始采用事后抽样调查控制普查登记质量,1996年和2004的首次农业普查和经济普查也均采用事后抽查评估普查数据质量,相比理论发展,中国普查事后调查实践还需要不断完善。
首先,需要完善清查摸底环节的事后抽查技术。我国三大周期性普查在普查登记前均采用清查摸底(单位清查)编制普查名录,清查摸底的事后抽查关系到普查对象的登记准确性,需要在清查摸底结束后较短的时间内完成,发挥对普查对象名录的补充与更新作用。而净普查推断通过普查与事后抽查的核对,能够实现普查对象的误差过程质量控制,误差推断建立在抽样设计的基础上,实施快速简便。2000年人口普查和2006年农业普查欠缺清查摸底环节的事后抽查质量控制措施,相比之下2008年经济普查采用事后抽查检查单位清查质量,但质量检查工作并没有建立在完善的抽样设计基础上。为进一步提高普查登记的数据质量,在清查摸底环节需要采用净误差推断的技术方法进一步加强普查清查摸底(单位清查)阶段的事后抽查。对于经济普查和农业普查中的法人或产业单位清查,通过抽查结果对名录库及时更新;而人口普查和农业普查中的住户单位,采用事后抽查及时更新地址码库。在普查登记过程中也可根据需要进一步结合抽样设计进行净误差推断和过程控制,对包括涵盖误差、计量误差、处理误差等在内的普查登记误差效应进行控制。
其次,普查登记工作结束后,适于开展以全国为总体的事后抽查双系统估计,充分发挥双系统估计对普查遗漏的测量。我国2000年人口普查已尝试采用双系统模型对总人口数准确性进行评估,但相比国外成熟做法,还需要从抽样设计和估计方法上进行完善,用以满足模型假设。随着我国普查事后抽查制度的常态化,在农业普查和经济普查中有必要结合普查对象的遗漏特点采用双系统估计方法对普查数据准确性进行评估研究,有助于提高普查结果的数据质量;但活动单位和人口存在本质的差异,在研究基于双系统模型的农业和经济普查结果涵盖误差分析时,还需要根据具体普查内容从理论和实践上进一步深入研究。如果采用事后分层满足双系统估计用于评价普查数据质量的要求,对于人口普查,可选择年龄、性别、民族等作为事后分层标志;对于农业普查,可选择地域、地形、主要农作物种类,人均耕地面积等作为事后分层表示,对于经济普查,可选择职工人数、企业所有制、产值规模等作为事后分层标志。此外为了弥补事后分层的缺陷,结合理论最新进展实现
最后,完善事后抽查设计。科学的评估方法需建立在细致的事后抽查方案设计上,从中国三大普查最近一次的事后抽查方案设计看,在总体分层、样本量、抽样方法,样本代表性等方面存在进一步完善的空间。对于清查摸底的事后抽查,可以将误差推断目标缩小到各个县级行政单位,目的是在保证检查目的的同时尽快完成。对于全国为总体的普查总体质量评估,需要综合考虑地域特征、人口结构、经济发展水平进行复杂抽样设计,用以保证事后调查的有效性。
本文来源:https://www.dy1993.cn/X454.html