现在是 2020 年 11 月 1 日上午 9 点,九个小时之前,第七次全国人口普查正式启动。最快一小时内,就会有社区工作人员敲开你的门,对你完成十年一次的人口普查工作。
在中国,人口普查是如何进行的?前几次的普查究竟查到了什么?
1953 年,中国开始第一次人口普查。直到 2010 年《全国人口普查条例》的颁布,正式确定了每十年普查一次的步调,年份尾数为 0 的那一年,你就要跟普查员见上一面。
要搞清楚全国 14 亿人口的情况,必须保证普查工作有序展开,主要分三步。
首先是摸底调查。普查方案制定下来后,普查员要用 20 天的时间进行实地勘察,包括小区范围、楼层数量、住户分布,编绘出《普查小区图》和《户主姓名底册》,对社区情况有个大概的了解。
第二阶段,正式普查。
你需要回答关于住户及个人基本状况的 19 个问题,比如公民身份号码、户口登记地等。11 月 16 日之后,如果你足够幸运、成为全国住户里随机抽取的 10%,普查员还会再次上门请你填写长表,包括住房、工作、婚姻等 48 项内容。
相比往年的纸质版表格和手持终端,今年你在自己的手机上,用普查员给你的填报码和初始密码,也能完成短表的填报。
我们需要多少普查员,才能在 40 天内完成如此浩大的调查?
一名普查员大概要完成 250 人的登记,同时每 4~5 名普查员配备 1 名普查指导员。根据官方估算,今年全国需要约 700 万普查员和指导员。如果你符合招聘条件,也可以投身浩瀚的普查工作中,每登记一户到手 15~25 元。
采集到的数据将进入公安和医疗系统,与内部的户籍、出生和死亡情况进行比对和校正,最大程度保证数据真实,最后层层上报并汇总。
还有什么其他办法能知道人们报的数字没有出错呢?
以年龄为例,它是最容易出现误报的项目。这是印度 2011 年人口普查的年龄分布:
你可以很明显地发现一个奇怪的规律:每隔五岁左右,就会出现一个小高峰。我们帮你仔细算了算,年龄尾数为 0 和 5 的人数是平均人数的 1.71 倍。
在人口统计学里,对于这种报年龄时偏爱「凑个整」的现象,我们可以用「惠普尔指数」来刻画,它是评估年龄数据准确性最简单的计算方法,用来检验人们是否对某个年龄尾数有偏好。
在 23~62 岁年龄段,我们将尾数为 0 和 5 的人口数除以这个年龄段的人口总数,再乘 5,就能得到惠普尔指数 W。假设 W=1,表示年龄没有偏好;假设 1<W<5,则表示人们上报的年龄在一定程度上偏好尾数为 0 和 5。刚刚印度的惠普尔指数就是 1.71。
但这样的方法存在缺陷,它只能评估尾数为 0 和 5 的整体偏好,假如数据偏好尾数 0 而回避尾数 5,就会相互抵消,得出一个看似风平浪静的数字。
于是,人口学家继续完善并发展出新一套计算方法。通过上图的公式,我们将 0~9 共十个年龄尾数分别计算一遍,就能得到各自的尾数别修正惠普尔指数 Wi,进一步计算得到一个更加准确的总和修正惠普尔指数 Wtot。
用这种方法检验我国近四次人口普查数据,可以发现,我国的年龄尾数存在一定倾向,偏好 7 而回避 9,总体上还是相对准确的。
解决了数据可靠性问题,我们就能仔细分析过去六次普查的数据了。
下面这张图是历次普查得到的人口年龄金字塔,左边深色表示男性,右边浅色表示女性,每个横条代表某一年龄段的人数占比。
可以看到,上世纪五六十年代,人口加速膨胀,我国人口年龄结构处于年轻型。之后,计划生育政策的推行拉低了出生率,青少年人口与青壮年人口大致相当,人口数量增速放缓,年龄结构转为成年型。
二十一世纪的到来让这个金字塔正式迈入老年型,人口老龄化程度日益加重,在未来,人口数量将在到达顶点后开始下滑。
回到今天,人口问题同样反映在生育率上。中国的生育率常年低于 2,这个数据意味着每个家庭生育不到两个孩子。人口压力沉重,我们需要更多孩子。
2016 年 1 月 1 日,全面二孩政策开始实施,这一年有 1786 万个新生儿,其中二孩占 45%,出生人口达到 2000 年以来的峰值。可热潮很快冷却,2019 年只有 1465 万个新生儿,生育问题再次严峻起来,有关三胎的讨论也在不时涌现。
依照前两次人口普查的节奏,今年普查结束四五个月之后,主要数据公报就能出炉。
扎进人口普查数据的汪洋大海,你还能在性别、住房、人口比重等一系列问题上观察到有趣的现象。这些数据最终将成为房产税、社会化抚养等政策的重要参考,影响我们生活的方方面面。
如果你也期待这一次最新的人口普查情况,就请先热情地为普查员打开门吧!
来源:回形针PaperClip 微信号:papercliptv