评估专业知识的更新来啦!!!谢谢每一位伙伴的耐心等待。
明德一直在努力践行“让每一位公益从业人员具有评估思维,使每一家公益组织成为学习型组织”的使命,也希望借助专业的态度、知识与能力来达成。而专业源于专注、用心,在社会发展越来越快、焦虑也逐渐涌向心头之时,我们希望让伙伴们感受到来自明德的一颗温暖、积极的匠心。
此文基于明德内部学习会分享整理而成,大概需要10分钟阅读。我们将继续不定期为大家提供匠品,与君共勉~
公益组织在实施项目时最关心的问题之一便是:“项目干预是否为服务对象变化的原因?从因果识别的角度来看,“项目干预”是“因”(自变量),“服务对象产生的变化”是“果”(因变量)。如果能够通过科学的因果识别方法证明项目干预确实是服务对象产生预期变化的原因,那么自然也就能证明项目干预的有效性了。
因果识别是推断因果关系是否成立的过程。以“研究生学历对个人收入的影响”这一命题为例,最理想的因果识别方法就是比较同一个体分别在读研究生和不读研究生的情况下,收入的高低情况。但是很明显,一个人是无法在同一时间段内既读研究生,又不读研究生的。即个体的因果识别是无法实现的。面对这一困境,鲁宾(Donald Rubin)提出了潜在结果模型——在群体中进行因果识别,为因果识别的发展做出了重要贡献。
潜在结果模型
潜在结果模型(Rubin Causal Model)以个体接受干预必须是随机性的为前提,通过比较一群人同时发生接受干预和未接受干预的结果,以识别这群人的平均因果作用(Average Causal Effect)。
以下介绍的随机控制实验、自然实验和观察性研究就是建立在潜在结果模型的基础之上的。
①随机控制实验
随机控制实验(Randomized Control Trials)的原理是通过对比接受干预的实验组和未接受干预的控制组来判断干预的作用。
随机控制实验是学术研究中使用频率非常高的一种方法,它能创造出比较可信的控制组,也被称为“因果识别”的黄金标准。但是在实践中,自然科学领域的随机控制实验更具有可操作性——因为自然科学更容易通过实验环境创造出可信的控制组。而在社会科学研究中,由于研究对象的复杂性,随机控制实验就遇到了很大的挑战,例如很难做到随机,实验成本高,被试的不服从与流失、干预的伦理问题等等。仍然以“研究生学历对个人收入影响”这一命题为例,研究对象被分成两个群体进行对照,是否读研究生是自变量,但是我们无法控制对收入有重要影响的其它因素是相同的——因为人是复杂的,例如每个人的智力和能力水平等等都是不同的,我们无法控制这些因素,但是这些因素恰恰是影响收入的重要因素。即在社会科学研究中,由于无法设置出可信的控制组,造成了随机控制实验的低可信度和低操作性。
②自然实验和观察性研究
针对随机控制实验遇到设置可信控制组的挑战,自然实验(Natural Experiment)或观察研究(Observational study)应运而生。这两种方法也是建立在潜在结果模型的基础之上的,但较之随机控制实验,这两种方法不需要人为干预,为社会科学研究提供了新的思路和方法。但是在这两种方法中,研究能否成功非常依赖于实验设计思路是否巧妙,缺乏巧妙的设计思路极有可能导致研究的失败。假如我们要用用自然实验或者观察性研究的方法研究“研究生学历对个人收入影响”,那么就要利用现实中存在的事物作为干预条件,进行分组来做对比研究。但是我们是否能在现实条件中找到一个环境,能够满足——这个环境能将被试者分为两个群体,这两个群体除了学历是不一样的,其它影响收入水平的因素都是相同的(或者差别是可以忽略不计的)呢?也许能找到,但是这非常依赖实验设计的思路或者巧合情况,所以自然实验和观察性研究的可操作性也较低,并不适合应用于项目评估。
贝叶斯网络
计算派:结构方程模型&因果图
计算派的代表方法有结构方程模型(Structure Equation Model)和因果图(Causal Diagram)。这两种方法是建立在贝叶斯模型基础之上的。贝叶斯网络是一种系统地描述随机变量之间关系的语言,构造贝叶斯网络的主要目的是进行概率推理,即计算一些事件发生的概率。如果应用到项目评估的情境中,就是利用贝叶斯网络模拟项目干预和服务对象变化之间因果关系的概率。这种研究不仅研究因果效应的存在和大小问题,还探索了内在的因果机制。
贝叶斯网络将概率论和图论结合,综合利用了概率论的原则和图论的直观,降低了推理的计算复杂度。但是结构方程模型和因果图也存在一些局限性,比如不同因素之间的相互作用无法体现,干预不会影响其他因素的假定不可验证,难于获取所有因素的完整数据等。这些缺陷使得将计算派应用于项目评估领域的因果识别的可操作性较低。
结构方程模型
(图片来源:http://shenhaolaoshi.blog.sohu.com/144836423.html)
因果图
(图片来源: https://blog.csdn.net/GnahzNib/article/details/70244175)
格兰杰因果检验
验证项目干预有效性的新思路
以上介绍的随机控制实验、自然实验和观察性研究、计算派这三类因果识别的思路都是要研究服务对象发生的变化是否为项目干预的结果。但是从现实情况来看,一方面,因为这些方法的实施成本太高,评估机构的能力有限,所以在现实中的可操作性不高;另一方面,委托方的重点并不是项目干预到底对服务对象的变化做出了多少贡献,而是想了解项目干预是否是服务对象的变化有贡献。考虑到这两方面因素,格兰杰因果检验给项目评估提供一种新思路。
格兰杰因果关系检验(Granger causality test)是一种假设检定的统计方法,检验在平稳的时间序列中,一组时间序列X是否为另一组时间序列Y的原因。假设X代表项目干预,Y代表服务对象的变化,在Y对预测X没有作用的前提下,如果“X+Y的过去信息→Y的现在表现”的预测效果显著优于“Y的过去信息→Y的现在表现”,那么X就是Y的原因。简而言之,格兰杰因果检验研究是否因为有了X,Y的表现就更加显著了,即只证明X对Y是否有贡献,而不要求证明X对Y做了多少贡献或者X对Y做出贡献的内在机制。
图表说明:A点表示项目干预为零时,服务对象的变化为2;B点表示,当介入了项目干预时,服务对象产生的变化为5。即加入项目干预之后,Y的表现明显显著于未加入项目干预时的表现
基于潜在结果模型和贝叶斯网络的因果识别方法确实更加科学和深入,但是对于一般的公益组织来说,要想科学的证明项目干预对服务对象变化的作用真的非常不容易,因为严密地做好各种控制是非常困难的,退一步说,就算严格做好了各种控制,也不得不面对外部效度严重降低的问题,使得研究结论难以推广。所以,在现实的局限下,公益组织不妨尝试基于数据观察的方法——格兰杰因果检验。虽然格兰杰因果检验并不是真正意义上的因果,而是更接近与我们所说的“有影响”,但实际上,公益组织能够向公众证明自己的工作有效就已经足够了,使用其它方法反而增加了难度和降低了外部效度。所以综合各种因素考虑,公益组织可以尝试使用格兰杰因果检验方法证明其项目干预的有效性,这样既降低了难度,也能满足证明其项目干预是否“有贡献”的要求。
本文转自微信公众号“明德公益研究中心”
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!