主题：【原创】经济学的经验研究方法 -- Dracula

共:💬86 🌺446

老大河待整

【原创】Natural Experiment

Natural Experiment这个词用法很多。一些文章将所有的reduced-form的方法都叫做natural experiment。这一篇我就讲一下其他的被称为natural experiment的各类研究。下一篇再说randomized experiment。

一类被称作natural experiment的研究是比较政策推出前后行为的变化。1966年秋，罗马尼亚总统齐奥塞斯库下令禁止堕胎。Cristian Pop-Elechesy利用这一点比较1967年1月-10月出生的人后来的教育，收入以及犯罪情况。这段时间的前一部分出生的人的母亲怀孕在禁令颁布之前，应该有机会堕胎。后一段时间的人的母亲应该没有机会堕胎。由于只有10个月，其他因素应该变化不大，因此Pop-Elechesy把这些人后来教育收入的变化归因于堕胎政策的变化。这种前期和后期的比较有点像control组和treatment组。也有点类似于regression discontinuity，不过没有regression discontinuity来的有说服力。她的结果发现1967年后期出生的人后来的教育程度和收入要比前期出生的人要高，而犯罪率要低。她的解释是堕胎是当时罗马尼亚的主要避孕手段，而选择堕胎的主要是教育程度高，收入高的女性。1966年秋天的堕胎禁令增加的生育也主要集中在这个阶层的女性。因此这些多出来的孩子要比普通人的教育程度收入高。但是她发现如果将母亲的教育程度和收入加入回归方程，作为控制变量，结果显示1967年后期出生的人结果要差。换句话说，如果母亲的收入，教育程度相同，那么1967年后期出生的人的教育程度，收入情况要低于，犯罪率要高于1967年前期出生的人。她的解释是这是由于教育资源的限制，当然我前面提到的Donahue-Levitt的机制可能也在起作用。

Cristian Pop-Elechesy的这篇论文我觉得是在这一类研究中比较好的，但是我们考虑一下会发现也有一些问题。我们不能排除可能有其他因素变化导致前后两段时间出生的人的结果不同，因此如果她能加几个同罗马尼亚类似的国家，比如匈牙利，保加利亚作为对比组，也就是使用diff-in-diff的方法，说服力会更高。当然，我前面讲了即使是diff-in-diff我们可能还是会有一些疑问，为什么罗马尼亚选择了不同于其他国家的堕胎政策呢？导致罗马尼亚选择不同政策的因素是不是对教育情况收入情况也有影响呢？这些问题有多大影响要视具体的研究对象而定。

另一类被称为natural experiment的研究是由政府组织进行的实验。有名的例子是美国的negative income tax实验。当时美国的福利政策是设定一个贫困线，保证家庭的收入不低于这个水平，如果家庭的收入低于这个线，政府发放福利补足这之间的差额。这个制度的缺点在于它其实是鼓励低收入的人不工作。打个比方，假设贫困线是每周300美元。一个人的工资是10美元。假设他不工作的话，政府发放300美元救济，假设他工作30个小时，收入是300美元，救济是0，净收入还是300美元。因此对他来说理性的选择很可能是不工作，只领政府救济。对整个社会来说，这明显是没有效率的，经济学里叫dead-weight loss。

但是对于贫困人口，社会确实有义务帮助。为了解决这个问题，Milton Friedman提出了negative income tax的方案。比如15000美元以上的收入需要交收入税，但是15000美元以下的收入却可以得到政府相应的补贴（也就是负的所得税）。Friedman的方案是50%的负税率。一个家庭的收入如果是5000美元，它收到的补贴是0.5*(15000-5000)=5000，净收入是10000美元。收入如果是10000美元，补贴就会是2500美元，净收入是12500美元。这样就可以减轻dead-weight loss。政府既可以帮助贫苦人口，又不会形成养懒人的情况。这个方案看起来很有道理，但是真正实行起来效果如何不得而知。美国60年代末到70年代进行了4次实验。一共选择了8000多个家庭使用负所得税的方法，测量他们劳动供给的变化。但是这些实验的问题在于selection bias。也就是说政府没有权力强迫人加入实验。假设每个家庭都是理性的，他们计算加入实验和不加入实验的效用，如果每个家庭的效用函数不同，只有获得特别利益的家庭才会加入负所得税的实验。因此参加实验的家庭同普通的家庭有很大的不同，他们之间的比较并不能告诉我们这个制度推行到整个社会的结果会怎么样。换句话说，这种实验的问题在于它并不是真正randomized的。James Heckman在1979年提出解决这种问题的方法是用经济理论直接model家庭加入和不加入实验的效用和他们的决定。他的方法属于我后面要提到的structural那一派，他也因此获得诺贝尔经济学奖。他的方法的问题和大多数structural派的研究一样，在于对变量的概率分布需要作假设。一般的研究都选择正态分布，但是其实说不出任何道理。因此结果的可靠性很让人怀疑。Heckman在过去20年的研究方向就是希望找到non-parametric的估计方法。而Reduced-form这一派则找同randomized experiment接近的数据或者是做真正的randomized experiment。

有时一些政策或规定的本来目的并不是为了做实验，但却产生类似于随机实验的结果，基于这些政策规定的研究也被称作natural experiments。美国1970年-1973年越南战争服兵役采用抽签的政策。每个在服役年龄段的男性分配给一个号码，被抽到的就需要服兵役。但是高中生属于免服兵役的范围。1971年以前本科生也可以免服兵役。因此一个人如果不想到越南，他的号码又被抽到的话，他就有格外的动力呆在学校里接受教育。我前面说了，直接作回归研究收入和教育的关系有endogeneity的问题。影响教育选择的因素也影响收入。但是这里教育时间的变化是由兵役号码决定，而兵役号码很明显和收入无关。因此这同randomized experiments非常相似。通过比较被抽中的和未被抽中人的收入我们可以得出教育对收入的影响，并且克服了endogeneity的问题。Angrist和Krueger使用这个方法发现多受一年教育，收入增加6.6%。

Angrist和Krueger方法的缺点在于它有selection bias。被抽中的人有两个选择，或者在学校多待一年，或者到越南服兵役。选择留在学校里的人可能是更怕死，可能是因为和平主义的哲学，可能是因为对他们来说教育的回报相对较高。因此这里教育程度的增加并不是真正的randomized experiments。他们同整个人群并不完全相同，从他们得出的结果并不一定在整个人群适用。

最后举一个例子是Joshua Angrist最近的论文。美国教育制度改革争论的焦点问题之一是charter school。这一类学校的资金来源于政府，但是有较大的独立性。直接将学生成绩和学校类型作回归有endogeneity的问题，因为选择进入charter school学校的学生和家长可能和其他学生有很大的不同。在波士顿地区，近些年由于charter school学生成绩好，供不应求，申请数量大于学校的能力，学校使用抽签的方法决定录取名单。对于申请charter school的学生来说，最终是否被录取就是个randomized experiment。比较被录取和申请但没被录取学生后来的成绩就避免了endogeneity的问题。Joshua D. Angrist, Susan M. Dynarski, Thomas J. Kane, Parag A. Pathak, Christopher R. Walters他们使用波士顿KIPP charter school的数据发现在charter school就读同其他的公立学校相比，学生的数学成绩可以增加0.35个标准差，英语成绩可以增加0.12个标准差。因此charter school可以很大的提高学生的成绩。

元宝推荐：海天,陈经,老马丁, 通宝推：抱朴仙人,万里风中虎,苏城,

复【原创】Natural Experiment

家园

受教了，能谈一谈

林毅夫合作社TFP那篇文章吗？

可以认为是一个Natural Experiment吗？

复受教了，能谈一谈

家园

对不起，这篇文章我没读过

能不能给个链接，或者文章全名。

复对不起，这篇文章我没读过

家园

谢谢,

Lin, Justin Yifu, 1990. "Collectivization and China's Agricultural Crisis in 1959-1961," Journal of Political Economy, University of Chicago Press, vol. 98(6), pages 1228-52, December.

复谢谢,

家园

我觉得应该不算natural experiment

实验的意思说保持其他因素不变，ceteris paribus，只改变一个因素，观察结果的变化。然后把结果的变化归因与这个特殊因素的变化。好的reduced-form的研究，数据都是可以被分成treatment组和control组，Ceteris paribus的假设至少在直觉上还是很有道理的（当然仔细考虑可能有一些漏洞）。因此象Cristian Pop-Elechesy的论文，只是使用1967年10个月的数据，因为跨越的时间一长，很难让人相信其它因素没有发生影响。林毅夫这篇文章研究的时间跨度有30年，我觉得不符合这个条件。因此这篇文章是提出一项新的理论对一部分事实进行解释，但是谈不上是natural experiment。如果这篇文章只是用57-60年的对比说明这一阶段国家政策的灾难性后果，我觉得可以算是natural experiment，不过这是常识，没有什么新意，只是这个发不到JPE这么好的刊物。

复我觉得应该不算natural experiment

家园

有理，

关键是当时的微观数据没有，否则是一个很好的思路，现在就只能是个博弈模型。谢谢。

复【原创】经济学的经验研究方法

家园

楼主介绍的经济学研究方法，其实和股市研究很类似：

股市研究的重点，就是股票应该的股价是多少。低估买入就会赚，高估卖出也会赚。呵呵

基本假定是股价和每股的利润成一定比例，这个比例即是国库券利息。

比如每股盈利1元钱，国库券年利息5%，股价应该是1/5%=20块。

很久以前的股价应该就是这个样子。

但是，人们发现，除了基本因素外，还有很多其他因素。