西西河

主题:【原创】经济学的经验研究方法 -- Dracula

共:💬86 🌺446
全看树展主题 · 分页首页 上页
/ 6
下页 末页
家园 【原创】Natural Experiment

Natural Experiment这个词用法很多。一些文章将所有的reduced-form的方法都叫做natural experiment。这一篇我就讲一下其他的被称为natural experiment的各类研究。下一篇再说randomized experiment。

一类被称作natural experiment的研究是比较政策推出前后行为的变化。1966年秋,罗马尼亚总统齐奥塞斯库下令禁止堕胎。Cristian Pop-Elechesy利用这一点比较1967年1月-10月出生的人后来的教育,收入以及犯罪情况。这段时间的前一部分出生的人的母亲怀孕在禁令颁布之前,应该有机会堕胎。后一段时间的人的母亲应该没有机会堕胎。由于只有10个月,其他因素应该变化不大,因此Pop-Elechesy把这些人后来教育收入的变化归因于堕胎政策的变化。这种前期和后期的比较有点像control组和treatment组。也有点类似于regression discontinuity,不过没有regression discontinuity来的有说服力。她的结果发现1967年后期出生的人后来的教育程度和收入要比前期出生的人要高,而犯罪率要低。她的解释是堕胎是当时罗马尼亚的主要避孕手段,而选择堕胎的主要是教育程度高,收入高的女性。1966年秋天的堕胎禁令增加的生育也主要集中在这个阶层的女性。因此这些多出来的孩子要比普通人的教育程度收入高。但是她发现如果将母亲的教育程度和收入加入回归方程,作为控制变量,结果显示1967年后期出生的人结果要差。换句话说,如果母亲的收入,教育程度相同,那么1967年后期出生的人的教育程度,收入情况要低于,犯罪率要高于1967年前期出生的人。她的解释是这是由于教育资源的限制,当然我前面提到的Donahue-Levitt的机制可能也在起作用。

Cristian Pop-Elechesy的这篇论文我觉得是在这一类研究中比较好的,但是我们考虑一下会发现也有一些问题。我们不能排除可能有其他因素变化导致前后两段时间出生的人的结果不同,因此如果她能加几个同罗马尼亚类似的国家,比如匈牙利,保加利亚作为对比组,也就是使用diff-in-diff的方法,说服力会更高。当然,我前面讲了即使是diff-in-diff我们可能还是会有一些疑问,为什么罗马尼亚选择了不同于其他国家的堕胎政策呢?导致罗马尼亚选择不同政策的因素是不是对教育情况收入情况也有影响呢?这些问题有多大影响要视具体的研究对象而定。

另一类被称为natural experiment的研究是由政府组织进行的实验。有名的例子是美国的negative income tax实验。当时美国的福利政策是设定一个贫困线,保证家庭的收入不低于这个水平,如果家庭的收入低于这个线,政府发放福利补足这之间的差额。这个制度的缺点在于它其实是鼓励低收入的人不工作。打个比方,假设贫困线是每周300美元。一个人的工资是10美元。假设他不工作的话,政府发放300美元救济,假设他工作30个小时,收入是300美元,救济是0,净收入还是300美元。因此对他来说理性的选择很可能是不工作,只领政府救济。对整个社会来说,这明显是没有效率的,经济学里叫dead-weight loss。

但是对于贫困人口,社会确实有义务帮助。为了解决这个问题,Milton Friedman提出了negative income tax的方案。比如15000美元以上的收入需要交收入税,但是15000美元以下的收入却可以得到政府相应的补贴(也就是负的所得税)。Friedman的方案是50%的负税率。一个家庭的收入如果是5000美元,它收到的补贴是0.5*(15000-5000)=5000,净收入是10000美元。收入如果是10000美元,补贴就会是2500美元,净收入是12500美元。这样就可以减轻dead-weight loss。政府既可以帮助贫苦人口,又不会形成养懒人的情况。这个方案看起来很有道理,但是真正实行起来效果如何不得而知。美国60年代末到70年代进行了4次实验。一共选择了8000多个家庭使用负所得税的方法,测量他们劳动供给的变化。但是这些实验的问题在于selection bias。也就是说政府没有权力强迫人加入实验。假设每个家庭都是理性的,他们计算加入实验和不加入实验的效用,如果每个家庭的效用函数不同,只有获得特别利益的家庭才会加入负所得税的实验。因此参加实验的家庭同普通的家庭有很大的不同,他们之间的比较并不能告诉我们这个制度推行到整个社会的结果会怎么样。换句话说,这种实验的问题在于它并不是真正randomized的。James Heckman在1979年提出解决这种问题的方法是用经济理论直接model家庭加入和不加入实验的效用和他们的决定。他的方法属于我后面要提到的structural那一派,他也因此获得诺贝尔经济学奖。他的方法的问题和大多数structural派的研究一样,在于对变量的概率分布需要作假设。一般的研究都选择正态分布,但是其实说不出任何道理。因此结果的可靠性很让人怀疑。Heckman在过去20年的研究方向就是希望找到non-parametric的估计方法。而Reduced-form这一派则找同randomized experiment接近的数据或者是做真正的randomized experiment。

有时一些政策或规定的本来目的并不是为了做实验,但却产生类似于随机实验的结果,基于这些政策规定的研究也被称作natural experiments。美国1970年-1973年越南战争服兵役采用抽签的政策。每个在服役年龄段的男性分配给一个号码,被抽到的就需要服兵役。但是高中生属于免服兵役的范围。1971年以前本科生也可以免服兵役。因此一个人如果不想到越南,他的号码又被抽到的话,他就有格外的动力呆在学校里接受教育。我前面说了,直接作回归研究收入和教育的关系有endogeneity的问题。影响教育选择的因素也影响收入。但是这里教育时间的变化是由兵役号码决定,而兵役号码很明显和收入无关。因此这同randomized experiments非常相似。通过比较被抽中的和未被抽中人的收入我们可以得出教育对收入的影响,并且克服了endogeneity的问题。Angrist和Krueger使用这个方法发现多受一年教育,收入增加6.6%。

Angrist和Krueger方法的缺点在于它有selection bias。被抽中的人有两个选择,或者在学校多待一年,或者到越南服兵役。选择留在学校里的人可能是更怕死,可能是因为和平主义的哲学,可能是因为对他们来说教育的回报相对较高。因此这里教育程度的增加并不是真正的randomized experiments。他们同整个人群并不完全相同,从他们得出的结果并不一定在整个人群适用。

最后举一个例子是Joshua Angrist最近的论文。美国教育制度改革争论的焦点问题之一是charter school。这一类学校的资金来源于政府,但是有较大的独立性。直接将学生成绩和学校类型作回归有endogeneity的问题,因为选择进入charter school学校的学生和家长可能和其他学生有很大的不同。在波士顿地区,近些年由于charter school学生成绩好,供不应求,申请数量大于学校的能力,学校使用抽签的方法决定录取名单。对于申请charter school的学生来说,最终是否被录取就是个randomized experiment。比较被录取和申请但没被录取学生后来的成绩就避免了endogeneity的问题。Joshua D. Angrist, Susan M. Dynarski, Thomas J. Kane, Parag A. Pathak, Christopher R. Walters他们使用波士顿KIPP charter school的数据发现在charter school就读同其他的公立学校相比,学生的数学成绩可以增加0.35个标准差,英语成绩可以增加0.12个标准差。因此charter school可以很大的提高学生的成绩。

元宝推荐:海天,陈经,老马丁, 通宝推:抱朴仙人,万里风中虎,苏城,
家园 受教了,能谈一谈

林毅夫合作社TFP那篇文章吗?

可以认为是一个Natural Experiment吗?

家园 对不起,这篇文章我没读过

能不能给个链接,或者文章全名。

家园 谢谢,

Lin, Justin Yifu, 1990. "Collectivization and China's Agricultural Crisis in 1959-1961," Journal of Political Economy, University of Chicago Press, vol. 98(6), pages 1228-52, December.

家园 我觉得应该不算natural experiment

实验的意思说保持其他因素不变,ceteris paribus,只改变一个因素,观察结果的变化。然后把结果的变化归因与这个特殊因素的变化。好的reduced-form的研究,数据都是可以被分成treatment组和control组,Ceteris paribus的假设至少在直觉上还是很有道理的(当然仔细考虑可能有一些漏洞)。因此象Cristian Pop-Elechesy的论文,只是使用1967年10个月的数据,因为跨越的时间一长,很难让人相信其它因素没有发生影响。林毅夫这篇文章研究的时间跨度有30年,我觉得不符合这个条件。因此这篇文章是提出一项新的理论对一部分事实进行解释,但是谈不上是natural experiment。如果这篇文章只是用57-60年的对比说明这一阶段国家政策的灾难性后果,我觉得可以算是natural experiment,不过这是常识,没有什么新意,只是这个发不到JPE这么好的刊物。

家园 有理,

关键是当时的微观数据没有,否则是一个很好的思路,现在就只能是个博弈模型。谢谢。

家园 楼主介绍的经济学研究方法,其实和股市研究很类似:

股市研究的重点,就是股票应该的股价是多少。低估买入就会赚,高估卖出也会赚。呵呵

基本假定是股价和每股的利润成一定比例,这个比例即是国库券利息。

比如每股盈利1元钱,国库券年利息5%,股价应该是1/5%=20块。

很久以前的股价应该就是这个样子。

但是,人们发现,除了基本因素外,还有很多其他因素。

比如今年盈利1块钱,去年盈利5毛钱,前年盈利25分钱。那么明年的盈利可能就是2块钱,那么明年的股价就应该是2/5%=40块。

而2块钱的盈利是一种简单的依照过去的历史做的未来分析。为了提高它的精度,可以对盈利进行各种更精细的分解研究:

微观如管理费用、比如订单预测、比如竞争分析。。。。。

宏观如通货膨胀率、MX、年利率。。。。。

这种方法应该是楼主提到的structural方法吧。也是股市专家们的方法。

另外还有一种办法,就是看股市本身:

基本假设在于,股市被操作,就一定有痕迹可寻。

这种股市被操作,在规范的市场,可以理解为前景被看好,被大量建仓,或者前景不好,被大量减仓。在不那么规范的市场,可以理解为主力建仓、洗盘、拉升、出货等等一系列直接操纵股价的不法行为。

而针对股市操作,其实也可以建立一个模型,从股价的走向、成交量的统计、股价表现的行为模式等等来推测股价所处阶段,预测股价的未来走势、涨跌幅度、或关键点位等等。

这应该是类似介绍中的统计类方法:reduced-form吧。也是股市炒家、散户的方法。(那些市议员、市长什么的,最多也就是个散户的水平。呵呵)

以个人看法:

structural的方法优点在于对事情的成因、有深刻的理解,但是实用起来效果未必很好,尤其是小波动情况。主要是不可能穷举所有因素及确定他们的权重。而大波动时,人的主观因素又有很大影响。或者说看人的疯狂程度就知道事情不妙。

reduced-form的方法简单、直观,但缺点在于它是一个局部研究。而局部的变动,可能只是整体波动的一个小片段,即使指标完全相同的两个场景,也可能因为一个是上升趋势中、另一个是下跌趋势中,结果迥异。容易造成盲人摸象的争议。

所以,说回结果,还是老套:以常识为基准、宏观结合微观、道藏万物。

但是感谢楼主,把玄妙而不可捉摸的道,化为数学、公式、还有西西河的帖子,让我们普通人,也能真实的触碰一下。哈哈哈

家园 字字珠玑,西河之幸。
家园 means-tested benefits会导致退出劳动

市场。美国有类似于“每周工作20小时以上,才能领取补贴”的政策吗?

Angrist和Krueger使用这个方法发现多受一年教育,收入增加6.6%。

这个数字有点高,是years of schooling的coefficient, 还是获取文凭那一年的coefficient?

charter school学校使用抽签的方法决定录取名单。

是对所有申请者抽签,还是对一部分边缘申请者抽签?如果是后一种,就不能算是randomized experiment。

家园 新年好!催更啊
家园 受教还有钱拿, 不好意思ing

送花成功,可取消。有效送花赞扬。恭喜:你意外获得 16 铢钱。

参数变化,作者,声望:1;铢钱:0。你,乐善:1;铢钱:15。本帖花:1

全看树展主题 · 分页首页 上页
/ 6
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河