再谈“把实证研究进行到底” 联系客服

发布时间 : 星期二 文章再谈“把实证研究进行到底”更新完毕开始阅读5ae4ef70f46527d3240ce00b

出身的,Shleifer以前做corporate finance的,Acemoglu主要做labor economics的,尤其是human capital, 最近这几个人大量的工作在做实证,而且这两年他们最著名的一项实证研究,也是引起这两个人争论的一个研究,就是institution and growth,制度与增长之间的关系。还有一个人还没有得到克拉克奖,但是我觉得他完全够格,他也是Becker 的学生,Edward Glaeser,这人也在哈佛,他也做理论,但他最近大量的工作也在做实证,比如social economics,还有就是在institution and growth方面他也做过,这人什么都做,d 城市经济学里也执一方牛耳。你们看看这些人的研究工作就知道国际的前沿在什么地方。

二、实证和理论有怎么样的关系?

我今天站在这里讲实证的课,我会跟大家鼓吹实证有多重要,但这并不意味着理论不重要。有一次上课,有一个同学听见我讲了这句话以后就问,陆老师,你实证重要,到底理论重要还是实证重要?我说,现在还有人问这样的问题啊?如果有个人告诉你,理论比实证重要,你就把他当疯子就可以了。理论和实证都重要,我今天讲实证重要,并不意味着理论就不重要了,相反,理论非常重要。那么理论和实证之间到底有什么样的关系呢?我先讲两句话给大家听听,这话都不是我的话,是别人说的,我来转述一下。

第一个是我的同学,现在在加拿大女王大学,丁维莉。她有一次讲到一句话,她说我为什么把实证研究来作为我职业的选择呢?因为有一次在开国际会议的时候,有两个搞理论的人争得不可开交,后来有一个实证经济学家说你们别吵了,我给你们看看证据,于是理论经济学家就不吵了。她说从那以后她就坚定了自己做实证经济学的信心。

还有一个就是我刚讲到的我的一个学生,现在在鲁汶大学,叫纪月梅。这次寒假的时候,我也跟她讲,面对很多来自于学生的困惑,就是学生不重视实证,觉得实证很简单,很好做,理论做不了再做实证。她现在做理论,但她在听我讲这句话时眼睛充满了惶惑,她心想复旦的学生怎么会这样,然后她就讲了这样一句话,“我觉得实证经济学家应该多看理论文章,而理论经济学家应该多看实证文章”。为什么呢?大家想想看,什么叫经济学?我借用王永钦老师的一句话说,经济学理论不在于创造,而在于发现。经济学家有没有这样一个本事,说我们来创造一个理论?经济学家没有这样的本事,他们的本事在于发现现实生活当中存在的规律是什么?那么什么是规律呢?规律无非就是去解释,x为什么会导致y?那么在这之前,你首先要知道x导致了y,于是你才去解释为什么x导致了y。所以实证经济学对于理论来讲,就可以帮你提炼出在这个世界上所存在的事实。就在这个礼拜二,在图卢兹读博士的李婷到我们学院来做seminar,她是做理论的,她说,“我这次回来,觉得在中国可以做的东西太多了,我每天看报纸看新闻,我就跟我妈讲,好多事情都可以做一篇文章。”她讲的是什么意思?其实理论经济学家的灵感是来自于对现实的观察。报纸是一种观察,电视也是一种观察。而实证经济学家可以做的是提供一种更加科学的,可以被大家确信的观察,如此而已。计量经济学家基于大样本的数据和科学的方法所得到的结论,更加可信,如此而已,所以他可以给理论经济学家提供事实基础。

我刚才讲了实证对于理论为什么重要,那接下来要讲的是实证也必须要基于理论。这里我就要反驳大家一种观点:你们看大量的计量文章的时候,看到的是计量经济学家把10几个变量往方程右边一摆,就出结果了,反正stata都会自动报,在写文章的时候就说x和y正相关,x和y负相关,就ok了,不是这样的。

5

实证研究必须基于理论。当然我这里讲的基于理论并不一定是指基于那些已经发表的数学模型的理论,不是这个意思。你在做实证研究的时候,一开始,从变量的选取到变量的度量,再到模型的设臵,都必须要基于理论,或者说得更通俗一点,必须要有理论基础,要能说出为什么,否则你要提高计量方程的R2非常容易,就一次项放了放二次项,二次项放了放三次项,三次项放了放四次项,……可是有什么意义?如果这样去做计量,没有意义。在放每一个高次项的时候,为什么变量间是这样一个关系,我们根本不知道,因为现在的经济学理论如果告诉我们变量之间有一个非线性的关系,通常在二次项的时候就停止了,很少有人告诉你还有三次项的关系。

第二个方面,就是避免data mining。你们以后在作实证的时候会发现,经常会碰到这样的情况,一个结果出来以后发现跟事前预期不对,有的时候是不显著,有的时候是你以为是正的,结果出来是负的。有一种做法称之为data mining,就是试,不断的试,不断的加变量减变量,不断的增加二次项三次项,或者减掉二次项三次项,再加个log项,然后再加个交互项,然后把数据的度量从FDI变成trade,……从这个意义上来讲,做计量的人都知道,计量可以帮你得到你想得到的任何结果,这就是data mining。如果计量都这么做,那太可怕了,那我们就不要去做计量了,事先就已经知道结论了。那么怎么来避免data mining呢?在具体做计量之前,你已经有一个理论的判断,然后再去做一个计量,一时发现得到的结果跟理论判断不一样,这个时候你要小心,你首先要去想为什么?是什么地方出了问题?之后再把问题找到,根据你找到的为什么会出现问题的原因再去调整你的模型和数据,这就不是data mining。在实际操作的过程中,data mining和我讲的根据理论判断去调整数据和模型之间的界限是很模糊的,但只有严格按照理论的指引得到的结果才是经得起检验的。在现在的学术制度下,你如果只是凑结果,而犯一些非常明显的错误,是不可能发表成果。

第三,──可能这话稍微有点过分,──对于理论经济学家,你可以片面而深刻,但对于实证经济学家来讲,必须全面,而且悉心洞察现实。大家知道做理论, x和y之间的关系或者相关性,有很多种可能。对于做理论的人来讲,其实他们的工作就是讲一种可能的机制就行了。如果你希望自己的模型复杂一点,丰富一点,可以多讲几种机制,但不需要把x和y之间所有的机制在一个模型里全讲清楚。所以从某种意义上来讲,理论经济学家可以片面的深刻,但做计量经济学就不能这样了,因为当你遗漏掉一个重要的机制或者重要的变量的时候,首先就会出现系数估计的偏误。所以对于计量经济学家来讲,在想到要做一个问题,接下来要去选数据、建模型的时候,必须事先对文献非常熟悉,就是理论经济学大概做过什么,有一些什么理论?前人在做类似的工作的时候怎么设模型,怎么选数据的?之后再做自己的工作。这个时候,遗漏掉任何重要的变量和文献都是非常危险的。

接下来要讲的问题就是,数理的模型和计量之间的关系。现在有一种看法是说,计量之前要先写一个数学模型,这样才上档次,不是这样的。如果你的计量模型可以建立在数学模型的基础上,我只能说这更好,至少是好于或等于没有数学模型。但有的时候它不是一个必需的东西,而且我特别要反对的是,大家为了追求计量模型前面要有一个数学模型,就硬摆一个数学模型在那里。我碰到很多文章,前面的数学模型跟后面的计量模型根本对不起来。那么,什么时候数学的工作在计量之前不是必需的呢?我列举这样几种情况:

6

第一,理论已经有了,可以直接去检验,这个时候你的创新就是提供证据。比如说,在理论上,在美国教育经济学界,大家都认为学校间的竞争有利于提高学校的效率,于是会对学生的表现有正面的影响,理论上大家都认为是这样,但事实上是不是这样呢?你不需要有数学模型的,只需要直接去检验就行了。而且现在在做的这方面的工作都没有数学模型,这也成为教育经济学研究的前沿问题。

第二,我们已经有足够的互相竞争的理论,我们就去检验一下到底哪个理论更重要?比如我刚才讲的,我们自己也做的,不平等和增长之间的关系。有人讲是正的,有人讲是负的,那我们把它们放在一起,看看到底是正是负。有人讲短期是正的,长期是负的,那我们也把它们放在一起,看看短期和长期是不是有这样的差别。

第三,如果机制已经非常清楚,并不需要什么东西都写成数学模型,数学模型是帮助我们看人脑可能看不清楚的机制的。如果人脑的思路已经够清楚了,就不需要数学模型了。比如说,在social economics 或者教育经济学里面有这样一些课题非常热,第一个是peer effects(同群效应),说的是你的成绩受到你同学的影响。比如在同学中会看到喜欢学术的往往是同一个寝室的,大家相互影响就都喜欢学术了,喜欢打电脑游戏的也住在一起,这就是peer effects。那么这个东西我们是不是要用一个数学模型去写,为什么喜欢游戏的人会影响到周围的同学呢?对于做实证经济学的人来讲,大家都觉得这件事情可能是存在的,我只不过是去identify到底是因为人们住在一起以后才受到了peer effects,还是相同类型的人事前就选择住在一起。对于实证研究来讲,更重要的是这个问题。

第二个例子,大家知道在现实世界中有所谓居住区的分割,就是穷人和穷人住在一起,富人和富人住在一起,然后有人就说,当存在social interaction的时候,由于穷人和穷人在一起,大家都相互有负面的影响,富人和富人在一起互相也有负面的影响。于是穷人的人力资本的积累就减慢了,他们的失业概率就提高了。可是这里面就碰到实证上一个很大的问题,你观察到的这种现象到底真的是因为social interaction导致的,还是事先对人力资本都不偏好的穷人选择住在了一起?这也是我们不知道的。这个东西需不需要数学模型呢?对于实证经济学家来讲也可以不写,因为更重要的是去identify到底是哪种情况导致的?人和人住在一起就会相互受影响对于实证经济学家来讲不需要去写数学模型。

第三个我要举的例子就是social multiplier。大家知道在经济学很喜欢乘数,比如凯恩斯乘数,就是一点点货币政策、财政政策可以通过凯恩斯乘数放大。现在社会经济学的发展里面就提出这样一个新的概念叫social multiplier。就是说如果人和人之间的相互影响是存在的话,那么一点点政策的效果就可以通过人和人之间的相互影响而不断放大。比如上海市有一个项目叫“百万人学礼仪”,就是政府投入一笔钱来让大家提高礼仪修养。大家想,你学了这些礼仪之后回到你的社区或者同事里面,你可能就会影响到他们,大家会觉得怎么这个人穿得好了或者吃饭的样子好了,他就会来学你。那么这种效应不需要通过政府的政策实施就会存在,所以你在去评估整个政策效果的时候,你看到的是最终效果,这个最终效果除以政策直接作用的那个人的效果就是这个social multiplier的大小。在实证上这个social multiplier到底存在还是不存在?到底有多大?这个也成为实证研究上非常前沿的课题,这个也不需要数学,因为我们都知道这个事情要么存在要么不存在,就通过人和人之间的互动就产生了。

在有一些研究课题里面,实际上经济学家已经出现理论经济学家和实证经济

7

学家的分工,就象物理学家已经分工为理论物理学家和实验物理学家。这个时候如果你的比较优势是在实证方面,你不需要去做理论经济学家应该做的那些工作。因为在某些研究领域里面,理论经济学家所用到的那些工具和实证经济学家所用到的工具相互的进入成本是非常高的。我举个非常简单的例子,social network。社会网络的计量有一套方法,但是对于社会网络的形成的数理建模用到的数学工具是图论。我不知道什么是图论,我只知道这个词。在我做的工作里面,我也会去做social network的形成和影响。但我要去做social network是如何形成的理论工作,对我来讲就是找死了。所以像这样的领域里面,你进入的时候就应该清楚你想做什么样的经济学家,这并不意味着那些会用图论的就比那些不会用图论的更加高明和聪明。因为对于那些做理论的人来讲,他也不知道这些东西到底在现实里有没有。这时候你要定位自己是一个实证经济学家,你就大胆去做就好了。

三、实证研究和中国经济学的发展有怎样的关系?

首先,我刚才已经举了很多的例子来告诉大家,实证研究在很多领域里面它是研究的前沿。那么,实证研究在哪些领域里面构成前沿呢?第一个在劳动经济学里面,实证研究在上世纪九十年代以后变得越来越重要,因为劳动经济学是一个典型的学科,它的理论已经基本上趋于完善了。所以,在九十年代以后,如果你说你是一个劳动经济学家,基本上大家就会把你理解为是一个应用微观计量经济学家,而不是理论经济学家。这个学科的发展已经到了一个以实证为主的阶段。

第二个就是我刚才讲到的两个例子,在产业组织和人事管理经济学里面,这些学科是从理论开始发展的,但是在它的理论大发展的时候,由于数据的公开性问题和数据的成本问题,经验研究非常少。而现在这些年,经验研究在这些领域里面构成了前沿研究领域。

第三个就是在很多的研究问题里面,我们根本就不知道事实是怎么回事。我们都能体会到,中国经济的发展、中国的制度、文化、人的行为,包括社会和政治的结构,跟现在经济学里面学到的一些东西不太一样,我们都模模糊糊地知道不太一样,但是从经济学研究来讲,我们实际上缺乏可以被经济学科学研究所确认的差异到底存在不存在?如果存在,到底有多大?我们不知道。所以现在大量的对于中国问题的理解,我们仍然是基于在西方的事实基础上所发展出来的理论来研究和理解中国的事实,但这样做,在很多时候我们就会对中国的问题看不透。如果你要提出一个对于中国的理解,构建一个新的理论的话,首先要做的就是,确实我们需要一个新的理论,因为我可以告诉你,在经验研究上它是有差异的。

我特别想强调实证研究在中国特别重要的几个理由:第一个是我刚讲到的,中国有一点不一样,但是什么地方不一样?事实还不是很清楚。第二是制定政策的需要。在中国现在所处的经济发展阶段,我们还没有足够的资源去养一批经济学家,他们可以不关注现实问题,就在书斋里读书,写paper,做所谓的纯理论。中国现在所处的阶段对应用研究的需求一定是非常大的,对此,非常重要的就是我刚才讲的policy evaluation,基于实证研究的政策评估。大家知道中国政府现在都讲科学决策,什么叫科学决策?在英文里面没有一个词叫scientific policy making的,但英文有一个词叫research-based policy making,我觉得这就是科学决策的英文翻译,我们现在讲科学发展观,也就是要多做研究。此外,中国的实证研究也是国际关注的焦点和趋势。以后你们有机会去参加会议,特别是国际会议里面关系到中国问题的会议,你就会发现,经验研究所占的比重是绝大多数。

8