时间: 2016-11-30 16:04
来源:
作者: 薛涛
“可道”是一些中国学霸好青年(好多在美国宾大哥大哈佛啥的和清华北大的毕业的)自发组织的一个节能环保知识性平台,周末与其创始人世行官员小吴和团队见了面。不同于国内很多ngo,他们很积极很上进很聪明很阳光素质很高眼界也很广,每个人自己都有很好的职业、收入和前途。谣言止于智者,在信息严重失真的微信世界,基于我对其人的了解,我相信可道。
把我的意思说的更明白点,国内一些环保NGO,从业者自身教育背景不足,也没有稳定的收入,对事物的看法不能客观深入,对金钱的态度也难把持,因此行为也就未必可靠。光靠热情和愿景,如何能持续抵得过这个粗燥复杂的世界?
——薛涛
附原文:
因为大气污染,北方人要比南方人少活5.5年吗?
来源:可道微信 作者:UCLA清洁空气中心
2013年8月,全球四大学术期刊之一,美国科学院院报(PNAS)发表了一篇论文,题为《基于中国淮河政策,看持续暴露于空气污染下对平均预期寿命的影响》。该文作者搜集了中国多个城市的空气污染以及人口死亡数据,得出的结论是,淮河以北由于享受国家免费供暖政策,空气污染水平明显高于以南地区,从而导致淮河以北的人口平均预期寿命减少了5.5年。
这篇文章涉及到政策,环境和健康等多个领域,影响力很大,众多媒体对这项研究进行了报道。例如纽约时报:
BBC的中文网站:
还有关心环境问题的微信公众号“稻田报告”:
以上媒体报道的标题都提到了减寿。看到这个悲伤的消息,家住中国北方的小伙伴们肯定不干了。凭什么啊,让咱们五六亿人都少活五年半?要知道这北方还有雾霾缭绕的帝都。不然怎样?选择搬到南方?放弃好心的政府提供的免费取暖?好像哪里不太对哦。
俗话说有图有真相,让我们看一眼PNAS上的原著,不难发现这5.5年的差距是“断点回归”的分析结果。下面是原文提供的预期寿命“断点回归”分析图:
在这个图里,圈圈表示各个被调查的城市。圈圈大小代表了城市的人口数量,圈圈的位置是由纵轴的平均预期寿命和横轴的地理位置(0代表淮河,负数是南方,正数是北方,单位是纬度)决定的。断点回归模型计算出来的预期寿命由灰色曲线表示。红线是以淮河为界,南北两岸预期寿命的差异。根据模型计算,这个差异显著【95%的置信区间为(-8.81, -1.27),不包含0,说明差异显著】。
可是作为吃瓜群众,我们只懂得算数平均值啊,要怎样才能理解这些经过了酱酱酿酿的统计模型计算,而产生的结论呢?
我们先不看图中这两条灰色曲线。每个城市是一个圈。蓝色圈圈的高低位置表示淮河以南城市人口平均预期寿命,绿色圈圈是淮河以北的数据。图中间的竖线表示淮河,比较一下位于淮河南北,距离淮河最近的城市人口的平均预期寿命,貌似北方城市比较高唉。再扩大一下范围,比较分别位于淮河南方和北方,距离淮河最近的三座城市人口的平均预期寿命,北方三城数据跨度比较大,但是如果只看平均值,南北方也看不出有什么区别。最后,图中南方一共12城,北方15城,如果只看平均值,也貌似没有明显区别呀。看到这里,大家似乎可以明白知乎上一个网友对原文的评价,“在不向外延伸讨论其它变量的情况下,保守地讨论本文的数据,也不能支持原文作者的结论。”
可是PNAS是国际著名期刊耶,怎么可能发不靠谱的文章呢?那么如果南方北方的平均寿命没差,淮河南北沿岸的平均寿命也没差,原文作者为啥说北方人寿命减少了呢?他们的依据是什么呢?
我们回过头来,再仔细看一下图中淮河两岸那两条妖娆的灰色曲线。虽然观测到的原始数据显示,紧靠淮河岸边的人口寿命大致一样,但是这两条由原始数据(圈圈们)拟合成的曲线,却出现了5.5年的截距差。正是这个截距差,使原文作者得出了北方居民人均寿命缩短五年半的结论。
可是平均值都差不多,为啥会在断点回归模型中出现截距差呢?这是怎么做到的呢?
这是因为概率统计模型描述的是“趋势”。即使淮河两岸许多地方没有观测数据,只要南北两边的数据呈现明显趋势,那么这个趋势就可以延伸到没有观测数据的地方,从而得到预期值。同时,即使在有观测数据的地方,趋势描述曲线给出的预期值也可能跟观测数据不符。
下面举一个简单的例子,解释一下“断点回归”统计模型,看看平均值一样的两组数据,当其中一组受到某种因素的影响,会出现断点。
《晏子春秋》记载,“橘生淮南则为橘,生于淮北则为枳,叶徒相似,其实味不同。所以然者何?水土异也。”说的是同一种果树,种在淮河两岸,结出了不同的果实。
简单起见,我们只把果实的大小作为指标进行研究,用字母D表示,同时用X表示种果树的地点到淮河的距离。我们假设淮河南方不受污染的影响,不论距离淮河南岸有多远,果实大小都是D=2。但是淮河北岸,紧邻岸边地带,受污染的影响,果实长得小。同时,离淮河北岸越远,污染影响力越弱,而其它原因致使离岸边越远的地方,果实长得越大。我们把淮河两岸果实数据放一起,得到了一个“断点回归”模型,如下图:
在这个假设的模型里,淮河两岸所有果实大小的平均值是一样的(D=2),但是紧邻河岸的地方,果实大小预期值产生了断裂,南岸果实的大小D=2, 而北岸D=0。
如果假设淮河没有污染,北岸和南岸种的果树都不受污染影响,在其他条件不变的前提下,那么结的果实大小会怎样呢?这种情况下,果实大小在淮河两岸就不存在截距差了,两岸结的果实是一样大的,没有了断点。请看下图。南岸果实的大小还是D=2,但是北岸果实平均值更大(D=4)。
讲完这个例子,我们再回来讨论淮河南北的寿命问题。如果原作者认为的原因(淮河北方由于取暖产生的污染)不存在了,平均寿命的趋势线在淮河两岸就应该连续起来,那么图中右侧的灰色曲线就会变成下图中的蓝色曲线:
也就是说,在没有空气污染的情况下,北方人民的寿命应该是按照蓝色曲线来预期的。淮河平均纬度大约是北纬33度,那么从北纬28度到北纬43度有个接近线性的趋势,越往北方人口寿命越高。差不多纬度每升高2度,寿命就增加一岁。
现在我们可以重新解读一下这个减寿5.5年的结论了:如果淮河北方没有空气污染的问题,会比南方人口平均预期寿命,高出大约5.5岁。而正是因为北方的空气污染,给了南方人一个跟北方人寿命持平的机会。 这很奇怪吗?这一点儿也不稀奇!很多研究都表明人类居住在温度相对低的地区,会比较长寿。这是因为人类的基础代谢属于生物化学反应,随温度升高而加快。温度高,代谢快,人体损耗就会增加,寿命就会缩短。
回过头来,再重新看一下我们上面提到,媒体们对这个结论的解读:
不难发现,媒体文章的标题都跟原文结论有很大偏差。原作者说的是北方人均寿命比没有污染的情况下减少了5.5年,而不是比南方人少了5.5年。这个减寿5.5年的结论,其实跟南方人没有半毛钱的关系!
原作中还分析了很多其他变量,提供了大量的数据图表。这里我们只分析了其中的一小部分数据和一张图,对比媒体文章的标题,已经可以看到不契合的部分。如果仔细对比原文和媒体的报道,或许还会发现更多问题。
对于原文作者,我们作为吃瓜群众,不黑不粉,只希望澄清一些误读误解。媒体解读科研文章,首先需要深入完整理解原文,才能避免扭曲误导。至于原文的结论,只能代表原文作者的观点,正确与否,还有待进一步检验研究。
编辑: 赵凡
武汉大学和北京大学光华管理学院获得理学学士和工商管理硕士学位。
现任E20环境平台执行合伙人和E20研究院执行院长,北京易二零环境股份有限公司总经理,湖南大学兼职教授,沈阳工业大学环境与化学工程学院兼职教授,华北水利水电大学管理与经济学院客座教授,中科院生态环境研究中心硕士生校外导师,天津大学特聘讲师,国家发改委和财政部PPP双库的定向邀请专家,住房和城乡建设部城镇水体污染治理工程技术应用中心村镇水生态环境治理领域专家,世界银行和亚洲开发银行注册专家(基础设施与PPP方向)、国家绿色发展基金股份有限公司专家咨询委员会专家库专家、巴塞尔公约亚太区域中心化学品和废物环境管理智库专家、中国环保产业研究院特聘专家、中国环保产业协会环保产业政策与集聚区专业委员会委员、中国城市环境卫生协会垃圾焚烧专家委员会委员,环境部“污泥处理处置产业技术创新战略联盟”特聘顾问。住建部指导《城乡建设》杂志编委、《环境卫生工程》杂志编委、财政部指导《政府采购与PPP评论》杂志编委,并担任上海城投、天津创业环保、碧水源、中建环能等上市公司独立董事。
在PPP专业领域,薛涛现任清华PPP研究中心投融资专业委员会专家委员、全国工商联环境商会PPP专委会秘书长、中国PPP咨询机构论坛第一届理事会副秘书长、生态环境部环境规划院PPP中心专家委员会委员、国家发改委国合中心PPP专家库成员、中国青年创业导师、中央财经大学政信研究院智库成员、中国城投网特聘专家等。
20世纪90年代初期,薛涛在中国通用技术集团负责世界银行在中国的市政环境基础设施项目管理,其后在该领域积累了十二年的环境领域PPP咨询及五年市场战略咨询经验,曾为美国通用电气等多家国内外上市公司提供咨询服务,对环境领域的投融资、产业发展和市场竞合格局有着深刻理解;2014年初加入E20研究院并兼任清华大学环保产业研究中心副主任,着力于环境产业与政策研究、PPP以及企业市场战略指导等方向。
出版书籍有《涛似连山喷雪来:薛涛解析中国式环保PPP》和《薛涛解析管理之道与认知之得》,其中,《涛似连山喷雪来:薛涛解析中国式环保PPP》于2018年12月1日正式出版,2021年11月再版;《薛涛解析管理之道与认知之得》2024年7月出版。
主要工作成果包括英国全球繁荣基金全国水务PPP示范项目典型案例研究 、城市水务市场化改革的进展与政策建议研究、贵阳南明河综合整治(BOT+TOT)项目(北控水务) 、财政部第二批示范项目世行贷款宁波厨余PPP项目等。