医学与社会
2016年05月号
医学进展
在他乡
有争议的话题

社会学中的随机对照试验

作者:马驰、邱梅

印度哈里亚纳邦出台了一项新的卫生优惠政策,当父母同意给孩子按标准接种疫苗后,这一家可以免费领取一公斤糖,如果孩子把所有计划内的疫苗都接种完了,他们家还可以免费领取一升食用油。

您不必惊讶,这是科学家在做研究,观察奖励措施能否提高该地区贫困儿童的疫苗接种率。遵循药物有效性测试中常用的随机对照试验(randomized controlled trials,RCTs)模式,科学家将该邦疫苗接种率最低的七个地区的门诊随机分配,有的门诊在孩子接种疫苗后奖励家长,有的则没有任何奖励。预计2016年会有初步的试验结果。但是小规模的试验表明,这种奖励措施很有希望提高疫苗接种率。2010年报道的一项印度的预试验显示,每月搭建医疗营可以让疫苗接种率提高三倍,如果再额外赠送每家一公斤小扁豆和一套盘子,疫苗接种率就会提高六倍。

美国麻省理工学院的经济学家Esther Duflo曾经参与过2010年的预试验,她说:“我们已经找到了免疫接种率低的部分原因。”人们并不是反对疫苗接种,而是生活上的确有这样那样的困难,没空啦,没钱啦,让他们没办法去诊所。这些困难其实可以用一点奖励来解决。

许多研究人员都想借助实验方法改革经济领域,检验社会项目的实施效果,从教育规划到交通事故预防,无所不包。因为他们热衷的方法是随机试验,所以他们也被冠以“随机主义者”(randomistas)之名,逐渐为大众熟知。

随机主义者在全球发展舞台上一直颇受欢迎。第二次世界大战以来,尽管有16万亿美元的援助资金流向了发展中国家,但是极少有经验数据显示这些钱的确改善了受援助国的民生。随机主义者认为,随机试验就是试金石,可以让政府在促进发展、减少贫困、把钱用在刀刃上时有真凭实据。

但是,并不是每个人都对随机试验的价值深信不疑。怀疑者表示,随机主义者只关注具体的援助项目,可能一叶障目不见泰山,忽略宏观经济学上的能源、基础设施、贸易和腐败等内容,而这些恰恰是一个国家是否会繁荣昌盛的根本,又恰恰无法用随机试验来研究。

赶上了时代

至少从20世纪60年代开始,RCTs就用于检验社会项目的效果。但直到1997年,墨西哥在公共政策方面开展了一项著名的有影响力的RCT,RCTs才走进现代社会。

1994年,墨西哥经济学家Santiago Levy临危受命,突破传统制定了一项现金补贴政策帮助墨西哥贫困家庭。为获取政府支持,他的团队开展了一项对照试验,比较传统的食品、能源补贴和现金补贴,哪种方式更有效。三年后,现金补贴组看门诊的次数比对照组多了60%,这一组的生病儿童减少了23%,贫血儿童减少了18%。这项研究后来被称为Prospera,它几乎纳入了墨西哥所有的穷人,为政府决策提供了有力证据,也激发拉丁美洲和非洲开展了类似项目。如今,有条件的现金援助计划成为全世界评价最高的项目,全得益于此。

就在同一时期,美国也作过类似的尝试。哈佛大学经济学家Michael Kremer在肯尼亚的研究显示,维修教室、补贴教材和校服能提高学生出勤率,但对考试分数没有影响。Kremer还作过其他项目的RCTs,但真正把RCTs推向主流社会的却是他当时的学生Duflo。Duflo认为从RCTs得到的数据可以准确评价政策和项目的优劣。她曾评估过1993年的印度宪法修正案,RCT的数据显示,议会由女性领导可鼓励其他妇女参与政治事务,妇女提出的议案也更容易得到肯定。

进入21世纪,从事RCTs的人多了起来。2002年,Duflo的学生Karlan加入她的队伍,和其他研究者一道在纽黑文成立了发展创新(Development Innovations)组织。2003年,Duflo又和两位麻省理工学院的经济学家共同创立了阿卜杜勒·拉蒂夫·贾米尔贫困行动实验室(Abdul Latif Jameel Poverty Action Lab,J-PAL)。J-PAL快速成长,目前已在62个国家完成了近600个项目评估,培训人数超过6600名。

风险投资

Rajiv Shah是盖茨基金会官员,自2010年起出任美国国际开发署(United States Agency for International Development,USAID)署长。他曾创建了发展创新风险(Development Innovation Ventures,DIV)基金,聘请Kremer为科学总监,希望用证据“把发展带到新的领域”。

DIV创办以来一共投资了一百多个发展项目,近一半都是RCTs。据说有一个RCT是这样的,华盛顿特区乔治城大学的两位研究人员在肯尼亚做了一个测试,看一种简单方法是否能减少当地的面包车车祸。在当地,面包车车祸死的人不少,有时候两辆面包车相撞就能造成40人死亡

2008年,肯尼亚的一千多名面包车司机参加了试验,研究者随机安排一部分司机在车厢内贴上标签,鼓励乘客发现司机鲁莽驾驶后直言不讳地批评投诉。从四大保险公司的统计资料来看,面包车内贴了标签后,重大交通事故的索赔案件下降了50%。

DIV了解情况后随即给研究人员拨款,支持他们扩大试验。规模扩大后的研究发现,面包车内的标签使索赔案件下降了25%~33%。DIV再次拨款,拿出了将近300万美元,帮助研究者把试验项目推广到全肯尼亚。

Kremer说,只有当发展中国家、企业或非政府组织看到RCTs的结果后决定改变政策时,DIV才算大获全胜。目前DIV面临的问题是,这样的投资策略能否超越文化因素的影响放之四海而皆准,或者说在甲地证明有效的项目能否直接在乙地推广。

前景看好

全球创新基金(Global Innovation Fund)于2014年9月成立,得到了英国国际发展部(Department for International Development,DID)、美国国际开发署等机构的大力支持,筹措了2亿美元,目标就是紧跟AID的严格评估模式,影响政治决策。该基会已经收到了110个国家的1800多份项目申请书。相对于全球每年在发展援助上的巨额投资来说,全球创新基金提供的帮助还只是杯水车薪。

2005年,世界银行设立了发展影响评价(Development Impact Evaluation)部门,对援助项目给发展中国家带来的影响进行评价。2003年,以RCTs或其他方式正式评价过的援助项目不到20个,2014年增加到193个,其中绝大多数项目都分布在农业、卫生和教育行业。部门负责人Arianna Legovini表示,正式评价过的项目只占世界银行全部援助项目的15%。评价一个援助项目平均要花50万美元,而该部门的年度预算才1800万美元,如果没有捐助资金作为后盾,这些研究根本没法开展。

世界银行尽量利用资源,直接和发展中国家合作,确保援助项目顺利进行。自2005年以来,有三千多人参加了世界银行举办的讲习班和培训班,其中大多数人都是受到援助的发展中国家政府官员。

此外,世界银行也在评价实施影响评价项目的作用。Legovini等人的分析显示,正式评价过的发展项目比没有评价过的项目更有可能按时实施,原因很可能是评价过的项目更受世界银行重视,项目从启动到开展到监管,各个环节都更容易走上正轨。这对单个项目来说是好事,但对很多RCTs来说就不一样了。因为,RCT情境下观察到的积极效应,可能在项目规模扩大之后就消失了,一旦有政府插手,其他人再怎么努力也无济于事。这时候,也许应该请研究人员和政府携手开展研究,保证项目规模扩大后,RCTs得出的好结果还可以延续下来,正如印度哈里亚纳邦政府正在做的一样。

背后的尴尬

从政治的角度看,好的RCTs因为结果能反映客观现实而让人喜闻乐见,但它的优点也可能成为人们对的理由。当地政府常常想把援助款项下发到社区敷衍了事,但国际捐赠者,包括发达国家政府和非政府组织,更期待看到一些品牌项目实实在在地改变了受到援助的世界,而不是竹篮打水一场空。如果一个项目在最初的RCT中失败了,那就很难再讨捐赠者们欢心。

人们一直在批评随机主义者难以克服自身的学术偏见。对RCT的执著可能让他们一直在小的政治问题上兜圈子,却忽略了更为重要的宏观经济学上的大问题。

Alexis Diamond是Duflo以前的一位学生,现供职于世界银行旗下的国际金融公司负责项目评估。在他看来,随机主义者和保守派经济学家之间的争论在很多方面都是关于权势和地位的。保守派经济学家终其一生都在钻研越来越复杂、越来越抽象的模型,随机主义者却走过来说“我们才不在乎那些模型呢,这年头还不是当权者说了算”。

Duflo对这样的争论不屑一顾,只想着如何为政府官员提供有价值的信息,让他们花钱花得精明。她认为,充分利用国际援助资金的最好办法,就是拿出对国际政府有用的证据。如果一切如她所愿,那么未来十年,当政府想了解某方面的情况时,就会理所当然地从随机对照试验中寻找答案。

(作者:马驰、邱梅)

参考文献:Nature 2015;524:150-153


Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5