2013年1月7日星期一

议"三年自然灾害"数据之自洽性

"三年自然灾害"或"1959-1961年大跃进饥馑"(三馑), 是中国当代史上沉痛的一页. 虽然历史的阵痛渐渐过去, 作为反思三馑的话题常常提起. 在金辉所著的 "'三年自然灾害'备忘录" 一文中, 作者引用中国政府官方统计数据试图论证所谓"三年自然灾害"不是自然灾害引起的. 假如能够证明官方数据的不自洽性, 将是对否定"大跃进运动"危害性的有力反击. 可惜我们经过定量分析官方数据发现, 该作者的论证站不住脚.

该文的论据主要有两个, 一是全国各地历年旱涝等级资料表, 二是全国自然灾害受灾和成灾面积表. 作者说, 前者比后者"更能准确地说明本来意义上的自然灾害的真实情况". 可惜并没有说明为什么 (显然易证得?). 因此这里不予采纳.

Fig. 1

上图是该文分析使用的旱涝等级资料表. 文章通过分析以上数据得出结论59-61年并无全国性大旱, 甚至是"风调雨顺的". 该文颇受诟病之处在于, 将旱涝指数的正负值简单的相加从而得到1959-1961年"风调雨顺"的结论. 这当然谬误之至. 其实数据本身已经能够说明59-61年并非全国性大旱大涝, 因为正常站的个数处于平均水平, 前提是这些气象站的分布比较合理. 而气象站的设计往往考虑到这一点.

对于自然灾害面积表. 作者声称即使官方数据可信, 单纯自然灾害也无法造成那么大幅度的粮食减产. 譬如72, 77年也曾有过大幅自然灾害, 并未产生大饥馑. 为了考察这个问题, 我们找到了人地系统主题数据库1949-1998年的完整数据. 我们使用自然灾害表, 全国粮食产量表和人口数量表 (参见下图).

Fig. 2: 全国自然灾害, 粮食产量, 人口数目逐年数据. 其中成灾面积为受灾耕地中粮食减产达到30%以上的耕地面积. 注意到, 自然灾害数据在1967-1969年有缺失.

通过比较可以发现, 受灾面积和成灾面积是成比例的, 大约40% - 50%. 所以从此以后使用受灾面积(或成灾面积)一个指标即可以. 我们这里使用受灾面积. 这些数据的特点是, 59-61年为一个自然灾害高峰, 似乎为官方的说法提供佐证. 沿着金文的思路, 我们仅考察59-61年的自然灾害幅度, 是否能造成当年那么大幅度的减产.

为了研究受灾面积对粮食产量的影响, 我们分为以下几个步骤.

我们首先将粮食产量和受灾面积分别进行线性拟合. 我们认为, 粮食产量和受灾面积的逐年数据, 是受到其他因素比如种子化肥农药农机的使用和耕地面积增加和/或其他不可知因素所主导的. 而实际产量和拟合之间的涨落, 则是受灾害影响的部分. 同样, 实际受灾面积与线性拟合的涨落, 是当年自然灾害的发挥作用的部分.

其次, 我们对粮食产量相比拟合产量的涨落与受灾面积相比拟合受灾面积的涨落进行线性拟合, 来寻求自然灾害对粮食产量的影响. 我们使用较为完整的70年以后的数据进行分析.

最后, 我们将分析的结果应用于59-61年的资料, 来比较实际粮食产量与预计受灾影响的粮食产量. 假如实际粮食产量远低于预计受自然灾害影响的粮食产量, 则说明59-61年的大饥馑确实不是自然灾害引起的.

Fig. 3: 粮食产量的分段拟合
图3 给出了粮食产量的分段线性拟合的结果. 两条直线具有几乎相同的斜率, 从此可以估计出59-61年饥馑粮食实际产量比预计产量减少27174万吨.

Fig. 4: 1971 - 1998年受灾面积的拟合
图4 给出了1971 - 1998年全国受灾面积的拟合. 我们未使用60年代的数据, 是因为67 - 69年资料缺失.

Fig. 5: 产粮涨落与灾害涨落的关联性和线性拟合. x-轴为灾害对灾害拟合值的涨落, y-轴为粮食产量对粮食产量拟合值的涨落.
图5 给出了粮食产量涨落与受灾面积涨落的线性拟合.两者之间有相反的线性关联, 这当然是因为灾害对粮食产量有负作用. 注意最左边的点对关联性有很大的影响, 去掉以后, 受灾面积对粮食产量的影响变大, 更加不利于证明"三年饥馑"不是自然灾害造成的. 我们暂时保留它.

将这些结果应用于全局数据, 尤其是59 - 61年进行检验, 可以得出图6 的彩色曲线的预言值. 可以看到, 在1959-1961以外的区间, 理论预言值与实际数据吻合的很好, 这也说明了我们模型的合理性. 注意, 60年代末理论值与实际数据的不符合, 是由于当年自然灾害数据的缺失引起的.

Fig. 6: 自然灾害对粮食产量的影响预言曲线. 绿色曲线为使用1958年以前的粮食产量拟合直线, 棕色曲线为使用1963年以后的粮食产量拟合直线 (参见图2). 红色曲线在1958-1963年区间将两者取平均的结果.

Fig. 7: 与图6相同, 但去除产粮涨落对灾害涨落数据中最左边影响线性性最大的点.

最后我们检验1959-1961年区间. 由于1959 - 1961是一个大的转折, 我们只能对这三年前后分别进行线性拟合. 两者对粮食产量的预言当然是不同的 (绿线和棕线). 但两者都预言由于1959 - 1961的大灾害, 粮食产量有一个明显的下降. 自然灾害引起的真正粮食减产量可能位于这条线之间任何地方, 这说明, 该区间的粮食减产至少有一部分是由于自然灾害引起的. 为了桥接两段模型, 我们也可以在1959-1960年区间对两者取平均. 其结果为图中红色的曲线. 这条线很好的落在实际粮食产量数据附近, 这说明, 59-61年的粮食减产, 有可能主要是由于自然灾害引起的.

需要说明的是, 这仅仅是半经验性辩论, 并非证明. 更不能说明官方数据的可信度. 我们的目的是为了讨论官方数据的自洽性, 这些半定量的论证说明, 官方数据的并没有金文所声称的极大的不自洽性. 究其原因是, 该文忽略了粮食产量在60年以后随着科技等因素的进步有了很大的提高, 抗灾能力也有所提高. 因而72, 77年及以后的灾害并没有59-61年的灾害明显, 更何况它们持续时间更短, 灾害幅度更小. 这一点可以亦可从人均粮食产量中看到. 1960年粮食产量仅为1949年内战刚刚结束时的水平, 这还不计中国政府进行的各种对外援助以及城乡差别. 而1972年, 1977年灾害时, 人均产量亦有所下降, 但当时幅度没有59 - 61年那么大, 持续时间那么长.

Fig. 8: 人均粮食产量.

所有这些论证仅仅从某一个侧面考察了官方数据本身的自洽性. 官方数据显示, 1959-1961年的饥馑, 至少有一部分是自然灾害引起的. 至于官方数据的可靠性甚至于历史事实到底几何, 则是研究中的问题, 目前诸家各有评说.

参看:

[1]: 金辉, "三年自然灾害"备忘录,新观察-大饥荒档案(www.chinafamine.net)