西西河

主题:【原创】经济学的经验研究方法 -- Dracula

共:💬86 🌺446
分页树展主题 · 全看首页 上页
/ 6
下页 末页
    • 家园 【原创】Regression Discontinuity

      Regression Discontinuity这个方法是在1960年被统计学家Thistlethwaite和Campbell发明的。到90年代末才开始被经济学家广泛使用。现在已经是reduced-form那一派工具箱里最常用的方法之一。

      经济学里比较早使用Regression Discontinuity的是Wilbert Van der Klaauw 2002年International Economic Review的文章。凭直觉,如果大学(比如纽约大学)给予新生奖学金,这个新生选择纽约大学的可能性会大大增加。但是现实中,成绩好,能力高的学生更有可能获得纽约大学的奖学金,但是这样的学生也更可能获得其它大学比如康奈尔大学的奖学金,因此简单的回归分析可能会显示获得奖学金同学校选择无关,存在endogeneity的问题。解决这个问题理想方法是我们随机选择一批学生给予奖学金,然后观测他们的学校选择,可惜经济学家申请不下这么多研究经费。Van der Klaauw注意到纽约大学发出奖学金有个公式,加权计算学生的各项特征比如GPA,SAT,父母收入等等。如果按照这个公式计算出的分数大于320分,学生会获得奖学金,319分的就得不到。对于得分319分和320分的学生来说,他们各方面的平均特征应该是近乎相同的,因此只要其他大学不是使用同纽约大学完全相同的公式,这些学生被其他大学录取或获得奖学金的可能性也应该近乎相同。因此比较这两组学生的选择来得到奖学金对学生选择的影响,就解决了endogeneity的问题。换一个角度来说,学生的考试成绩比如SAT并不是完全是由学生的能力决定,是有噪音的,其他因素也类似,因此每个学生按照公式计算出来的分数也是有噪音的。319分和320分的学生各方面非常相似,320分的学生获得奖学金,主要可以看作是噪音的影响。因此这些噪音可以看作是自然在作的randomized experiment,将特征非常类似的人分为treatment组和control组。因此我们比较这两组的结果不同,就可以得到奖学金对学生选择的影响。Van der Klaauw的结果是奖学金增加10%,学生选择纽约大学的可能性增加8.6%。

      就解决endogeneity的问题来说,我觉得regression discontinuity要比diff-in-diff和instrumental variable更有说服力,但是它也有一些局限性。就上面这个例子来说,这个研究的结果测量的其实是奖学金对320分左右学生学校选择的影响。这个结果对其他学生选择的适用度不是很明确。

      再举两个例子。

      Sandra Black研究的问题是一个好的公立学校对家长有多重要。换成经济学的术语来说是是hedonics,相对于一个差的公立学校来说,一个好的公立学校给家长增加的效用可以折算成多少钱。她的方法是利用地理上的discontinuity。假设有两个邻近的校区,一个校区的公立学校质量高,另一个质量低。那么在校区边界的非常类似的两座房子(同样的房间数,类似的面积等等),一座在校区A,一个在校区B,它们其他的环境因素应该也非常相似,比如犯罪率,买东西的方便程度等等。因此它们的主要差异就在于它们处于不同的校区,由此导致这两所房屋价格的不同。因此比较两座房子价格的差异,就可以给出好的公立学校给家长效用增加的金钱换算。Black使用马萨诸塞州的数据,结果是小学成绩增加5%,所在校区的房屋价格增加2.1%,在1999年的时候大致是4000美元。

      Sandra Black的方法确实是非常巧妙,但是如果我们仔细考虑,她的方法有个隐含假设,就是说校区界线的划定完全是随机的。为了解决可能的边界endogeneity问题,如果校区边界是公园,高尔夫球场,河流等等,她就不使用这些数据。但是如果加上这些数据就得不到她的结果,为什么只删除这些数据,其他有可能导致边界endogeneous的数据为什么不擅出呢?因此有人觉得她的结果有data mining的嫌疑。

      前面我已经解释了,简单的回归研究班级人数和学生成绩之间的关系有endogeneity的问题。一种解决办法是randomized experiment。1985年美国田纳西州花费1千2百万美元将7000名从幼儿园到小学3年级的学生随机分配到15个人或24个人的班级里,比较他们的成绩。实验结论是小班确实能够提高学生成绩。另一种解决方法就是regression discountinuity。Joshua Angrist和Victor Lavy注意到以色列小学的班级人数使用Maimonides’ Rule。如果学校一个年级的人数少于40人,那么就只有一个班,由一个老师来教。如果超过40人比如是41人,就分为两个班,每个班20或21 人。因此如果我们假设每年注册的学生数量是随机的话,在40,41 这个范围左右,班级人数的确定基本上也是随机的。这就像是自然在做的randomized experiment。如果我们比较年级40和41人学生的成绩,就可以得出班级人数对成绩的影响。他们的结果是班级人数减少10人,全班平均成绩增加0.75分(百分制)。

      Angrist和Lavy的方法非常巧妙,但是它有一个隐含假设,就是39人40人的班级学生的家长不会选择转学到小班级的学校,比如私立学校。如果是这样的话,我们现实中观测到的39人,40人班级学生的家长对孩子教育不是太关心,或者财力不够。这样的话,40人和41人的学校的学生会有很大的不同。我们有新的endogeneity的问题,这个design和真正的randomized experiment还有差异。Miguel Urquiola AND Eric Verhoogen使用智利的数据发现有钱人倾向于把孩子送到班级小的学校。因此Angrist和Lavy的结果很可能高估了班级人数对学生成绩的影响。

      元宝推荐:老马丁, 通宝推:响马,万里风中虎,
      • 家园 关于公立学校价值的一个观察实例

        相邻两个区,公立高中在全国排名,一个前一百,一个次一百,相同的房子,价格差10万。

      • 家园 大学ranking方面有相关研究吗?

        hedonics在经济学上是什么含义?享乐主义?

        • 家园 这方面研究的开创者是Sherwin Rosen

          最早是在Industrial Organization研究方面。普通的经济学模型假设在同一个市场里的物品都是完全相同的。但是事实上这样的市场非常少。同一市场上的物品总会有很多差别。为了简化分析,Rosen假设我们真正的需求并不是每个具体的商品,而是商品的性质,比如电脑,真正进入我们效用函数的是CPU的主频,内存,显示器的大小等等。比如房屋,真正进入我们效用函数的是房屋面积,房间数量,洗手间数量,车库数量,花园面积,是否有游泳池等等。将价格同这些性质的回归,叫做hedonic regression。比如我们可以得到游泳池增加房屋的价值究竟有多大。分析得到的参数就是这些性质的价格,叫做hedonic price,也就是这些性质用钱来度量的效用。就具体这个例子来说,Sandra Black研究的结果是校区的教育质量用钱来度量增加的效用是多少。

          Hedonic Regression还被用在环境经济学。可以用来研究空气污染减小的效用用钱来换算是多少。比如洛杉矶地区的某种污染物分布不均衡,我们可以用房地产价格差异来估计污染对效用影响的具体换算是多少。但是污染的分布很可能不是随机的,因此用回归的方法有endogeneity的问题,结果有bias。

          经济学里大学排名的研究我没见过,对经济系或刊物排名的研究到不少,它们具体的方法我从来没注意过。你用econlit,或google scholar应该有不少结果。

          • 家园 谢谢对hedonic的解释

            分解以后可以解决heterogeneity的问题,尤其在降价很快的电脑上,非常聪明的方法。

            大学ranking那个问题,我是想问,比如前20名大学,与21名,是否有regression discontinuity的研究?

            对问题本身也有些犹豫,因为大学与义务教育不同在于,大学的选择范围广,研究侧重点可能不在这个方面。

            • 家园 关于regression discontinuity

              最近的Journal of Economic Literature上有一篇文章。

              Regression Discontinuity Designs in Economics

              外链出处

              里面有一个表,列着几乎所有使用regression discontinuity方法的文章。

      • 家园 Stephen Machin和OLIVIER MARIE

        也在用这种方法研究教育和犯罪之间的关系以及学区房的价格,很有意思。

        这一块可能是地理学和经济学的交叉处。

    • 家园 在伯爵这里捞到4块钱~~~~~~~~
    • 家园 【原创】Instrumental Variable

      假设我们想研究A和B的关系。从统计学上讲,endogeneity的问题是说,存在我们不能直接观测到的C,同时和A,B相关。比如研究教育和收入的关系,能力高的人教育程度和收入都高,因此直接将教育和收入作回归结果会有bias。如果我们能发现另一个变量D可以导致教育程度变化,但是不直接影响收入,那么由D导致的教育程度变化就像是个randomized experiment,我们可以这个教育程度变化来估计教育和收入的关系。这种方法叫做Instrumental Variable Estimation,另外的变量D叫做instrument。

      用IV方法最有名的文章我觉得是Joshua Angrist和Alan Krueger 1991年估计收入和教育关系的文章。他们的instrument是一个人的出生时间(他们用的数据是出生的季度)。出生在哪个月份好像明显是随机的,同一个人的能力和家庭背景没有任何关系。因此它满足IV的第一个条件。而出生月份却影响美国学生的受教育时间长短。美国一般的校区都规定如果一个孩子在这一年会满6岁,他就必须在这一年秋天入学。而根据校区不同,如果一个学生满16岁或17岁,他就可以选择离开学校,不再接受教育。假设有两个学生,一个出生在1月1日,一个出生在12月31日。因此入学时,一个人是6岁零8个月,一个是5岁零8个月。两个人都不爱学习,想尽快离开校园逃出牢笼,因此一满16岁就会退学。因此第一个人实际接受教育的时间是9年零4个月,第二个人实际接受教育的时间是10年零4个月。第二个人由于美国的制度被迫多上了一年学。Angrist和Krueger使用美国人口普查的数据发现一个人的教育程度确实同出生季度有关。在第一季度出生的人比在其他季度出生的人平均教育时间稍短。因此出生季度即同能力无关,又可以影响教育,满足这两个条件,是个很好的instrument。他们的结果发现,IV的估计结果和普通的回归估计结果类似,因此普通回归的bias并不大。

      这篇文章不仅在劳动经济学,而且在整个应用经济学经验研究的影响都很大。他们的design确实非常巧妙,我今天写这篇文章时想起来都觉得赞叹。在它之前应用IV的文章,大多数只是断定某些变量是好的instrument,满足那两个条件。它们即使有一些统计学的检验,也不是很让人信服。而Angrist和Krueger的文章有一个很好的故事,让人听了以后就觉得很有道理,觉得那两个条件的满足是最自然不过的。这篇文章也成为IV研究的典范,影响极大。但是后来的研究表明,这篇文章其实也存在问题。

      一个是weak instrument。也就是说虽然出生季度同入学时间有关,但关系其实并不是很紧密。因此,使用出生季度带进了很多的noise,standard error变得很大,估计的结果并不可靠。而且我们真正考虑一下,这篇文章实际估计的是16,17岁不爱学习的人,强迫他们在学校多待一年对他们收入的影响。这个结果对其他人群,其他教育(比如大学教育,博士教育)的适用性很成问题。第二,最近Kasey Buckles和Daniel Hungerman有一篇文章发现美国在第一季度出生的孩子的母亲更可能是teenager,单身或者高中没有毕业。他们对此的解释是收入高,受教育程度高的女性更可能避免在冬天生育(不过我觉得他们没给出很让人信服的解释为什么这会发生)。因此出生时间其实同家庭背景有关,也就对收入有影响。因此并不是valid instrument。

      下面再举几个使用instrumental variable估计的例子。

      经济学家一般都相信竞争会提高效率。应用到教育领域,就是如果一个校区有好几个学校竞争的话,校长,老师会更卖力。不然,如果学校质量下降,家长会用脚投票,将孩子转到别的学校。学校老师的生计就会有问题。相反如果学校处于垄断地位,家长没有太多其它的选择,老师就不会太卖力,学生的成绩会低。但是如果我们直接将一个校区内的学校数和学生成绩作回归就会有endogeneity的问题。比如一个校区内好多种族,各个种族可能想有自己单独的学校。而多种族本身对学习成绩可能就有影响。另一种可能,假设校区里的一个学校特别成功,校区可能会让这个学校兼并其他学校来提高其他学校的质量,因此我们可能观测到竞争减少,成绩增加。但是这并不表明竞争本身对成绩有害。Carolyn Hoxby发现美国校区的划定同河流有关,由于美国早期交通不发达,学生渡大河上学有困难。因此河流多的地区,校区就小,相应的学校就少,学生的选择少,竞争就少。而一个地区的河流数量好像同学生的成绩没有什么关系。因此河流数量是个valid instrument。Hoxby的结果发现增加学校的竞争确实能提高学生成绩。(Jesse Rothstein后来认为Hoxby在河流数量的具体定义上是data mining,他们之间的争论,感兴趣的话可以找2007年的AER看一下。)

      Edward Miguel, Shanker Satyanath和Ernest Sergenti想研究经济增长是否降低内战发生的概率。他们研究对象是撒哈拉南部的40个国家。由于endogeneity的问题,他们使用降雨量作为instrument。他们的结果是经济萎缩5%,内战爆发的概率会增加50%。

      Daron Acemoglu,Simon Johnson和James Robinson研究政治制度对经济增长的影响。我前面已经解释了,普通的方法会有endogeneity的问题。他们用殖民时期欧洲人死亡率作为政治制度的instrument。他们的理由是如果这个地区死亡率低,欧洲人就会大幅度移民,更可能把他们原来的制度搬到新大陆。如果死亡率高,很少欧洲移民,欧洲人建立起来的更会是种掠夺性的制度,不利于长期经济发展。现实明显的例子,温带的殖民地,死亡率低,象美国,加拿大,澳大利亚,新西兰经济发达。加勒比海地区,非洲传染病多,死亡率高经济落后。他们数据分析的结果发现政治制度确实对经济增长影响很大。

      使用instrumental variable方法的关键是让读者信服instrument同解释变量相关,又确实同被解释变量无关。当然有一些统计学的检验可以做帮助,但是通过这些检验并不意味着这些instrument确实是valid的。就我举得后几个例子,如果仔细想一下,我们就会觉得这些instrument同被解释变量有关的可能性不大,但是并不能被排除。因此使用instrumental variable论文结果的可靠性同randomized experiment的理想标准相比还是有不小的差距。

      通宝推:万里风中虎,

      本帖一共被 3 帖 引用 (帖内工具实现)
      • 家园 鉴于valid instrument难找,有没有什么替代

        的办法?

        Acemoglu对英法殖民地制度设计不同的论述,很有趣。

        • 家园 现在最流行的是randomized experiment

          尤其是在发展经济学里,我后面会提到。我还会提到natural experiment和regression discontinuity。但是这些这些方法适用范围也并不大。现实的经济学研究往往是你先发现好的instrument,或其他好的design,然后再找和其相关的经济学问题。reduced-form这种方法重于经济学问题的态度,也是structural派攻击的一个方面。

      • 家园 后几个感觉上都不大靠谱啊。。。

        河流状况与交通、地区经济构成、实力和规模、以及居民构成都有关系;比如长江流域的水系发达,西部沙漠地带就没什么河流了。。。显然不是个无关项。

        当年降水量与农业、粮食产量明显相关,和内战概率更是直接挂钩;在我国历史上,水灾、旱灾导致的饥荒显然是农民起义的直接原因。。。风调雨顺的年景谁造反啊。

        最后一个简直都不用说了...

        这些经济学家不觉得这假设有些问题么?

        • 家园 你说的有一定道理

          真正valid的instrument非常难找。

          Hoxby的论文使用美国的9个地区作为dummy。因此你具体的反对意见不成立。但是Jesse Rothstein认为Hoxby选择了一个特殊的河流数量的定义。换另外几个至少是同样有道理的定义,Hoxby的结果就得不到了,她是data mining。我读了Rothstein的质疑和Hoxby的答复,我觉得Rothstein说得有道理。

          内战发生的概率同经济增长的关系我写得太简略了。你所说的正是他们研究的出发点之一,经济发展快,各种社会,种族之间的矛盾容易调和,发展停滞,甚至衰退,饼变小,各种力量之间的争夺就会变得激烈,内战就容易爆发。但是我们不能直接使用回归研究这个问题。原因是很明显发生内战的国家经济会倒退,因此有可能是reverse causality。或者可能有其他因素比如种族之间的仇恨既阻碍经济增长又导致内战发生。在非洲国家,经济主要是农业,靠天吃饭,因此由降雨量导致的经济变化,同这些其他这些因素无关。就好像老天在作randomized experiment,改变经济,看是否对内战发生有影响。这个instrument的问题是降雨量除了通过影响经济来改变内战发生概率以外,有没有别的渠道。如果有,这就不是valid instrument。我能想到一些可能的渠道,不过我对非洲的历史和具体情况实在知道的很少,不能确定这些渠道是否有道理。

          我不知道你对Acemoglu他们论文的具体反对意见是什么。他们想考虑政治制度对经济发展的影响。但是我前面说了,决定政治制度的因素很明显也会影响经济发展,因此直接的回归不行。他们的想法是各个国家在殖民时期的自然环境是exogeneous的。因此由它导致的政治制度变化就像是个randomized experiment。就避免了endogeneity的问题。他们的问题在于,导致一些殖民地死亡率高的因素除了影响政治制度之外,是否可以通过其他渠道与经济发展发生关系。我觉得有这些渠道,因此他们的instrument并不对。不过他们的想法还是有不少道理的,并不是特别可笑。

          • 家园 受教还有钱拿, 不好意思ing

            送花成功,可取消。有效送花赞扬。恭喜:你意外获得 16 铢钱。

            参数变化,作者,声望:1;铢钱:0。你,乐善:1;铢钱:15。本帖花:1

分页树展主题 · 全看首页 上页
/ 6
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河