再谈“把实证研究进行到底” 联系客服

发布时间 : 星期二 文章再谈“把实证研究进行到底”更新完毕开始阅读5ae4ef70f46527d3240ce00b

再谈“把实证研究进行到底”

──经济学研究谈话(之四)

陆 铭*

“把实证研究进行到底”是04年的时候我写过一篇文章,这文章发表在《经济学家茶座》上,引起了一定的反响,出乎我的意料,也说明实证研究在中国越来越受到重视。在这个时候,的确需要一些这样的文章来帮大家澄清一下对计量的一些认识。

今天,我特别想帮大家清除几个误解,这几个误解也恰恰是我在和同学接触的过程当中,从同学嘴里讲出来的误解,所以不是我生造出来的。

第一个误解是,实证研究就是应用性的,应用性的就不够学术,没什么价值,好像就是回答了一个现实中的问题,发现的结论好像是我们都知道的。

第二个就是大家都会经常讲的一句话,实证研究好做,比理论研究容易做,理论研究做不下去了就做实证研究。讲到这里,这个寒假刚刚迎来了我原来的一个学生,现在比利时鲁汶大学读博士,她最近做的工作和social economics有关系,做的是理论。我们在寒假碰到的时候就谈,我就问她,为什么你这个课题不做实证呢?她说实证太难做了。所以我想,在某些问题上,不是像大家所想的,理论做不了就做实证,可能正好是反过来,是实证做不了去做理论。我等会儿还会讲实证和理论的关系,我会告诉大家,理论和实证都非常重要,而且是互补的。

第三,同学们常常认为实证研究很简单,只要把数据往电脑里一放,结果就出来了,就可以写文章了。有一次,一位同事不无自嘲的地说了这样一句话:觉得很心虚,因为数据不是自己收集的,我们用的很多大样本数据都是别人收集的,idea也不算新,不是自己的,然后程序都是现成的,stata都是编好的。之后我们就把不是自己收集的数据,也不算太新的idea,往stata里一放,就出结果了,觉得很心虚。而我们的同学觉得经济学研究的高手应该是满纸数学符号加上自己编的程序,再画出非常fancy的图形,这就是水平高。

第四个误解是,很多同学认为现在我们研究中国问题,应该做理论,因为理论和国际接轨。特别是对于初学者来讲,考经济学的硕士和博士的时候,都是考的微观和宏观,然后一年级上课的时候上的大量都是微观和宏观的理论,所以你们就觉得那就是经济学的主流,只有做这个才上档次,哪怕做中国的研究,也应该把中国的问题写成数学,甚至干脆就不做与中国问题有关的研究。那是不是这样呢?是不是中国的经济学研究就应该首先做理论呢?

今天接下来我要讲的这几个问题就想尝试着去清除在大家脑子里面的几个误解。我今天会讲这么几个问题:第一个,我们为什么要做实证研究?第二个就是,实证跟理论,包括思想是一个怎样的关系?第三,实证研究跟中国经济学的发展又怎样的关系?第四,如何完成一项实证研究?

*

作者为复旦大学经济学院副教授,就业与社会保障研究中心、中国社会主义市场经济研究中心研究员。本文是作者在“截面和面板数据分析”一课上的第一讲。感谢李爽将其整理成记录稿。

1

一、为什么要做实证研究?

实证研究在现代经济学研究和发展过程中的功能我想有这么几个:

第一,实证研究是用来检验理论的。因为对经济学家来讲,我们有太多的理论,但是在现实中哪个理论正确与否,更重要或更不重要,其实离开了实践,我们是没有办法知道的,这是实证研究重要的第一个方面。而且从经济学的科学化的道路来讲,大家知道,第一届的诺贝尔经济学奖就是发给计量经济学家的,最近这几年也是连着发给计量经济学家。大家知道,对于科学来讲,一个重要的标准就是它可以被证伪,那我们怎么知道理论是正确还是错误的呢?经济学家实际上大量地依赖实证研究来使经济学成为一门可以被证伪或者证实的科学。

第二,to challenge the theory(挑战理论)。当一个理论产生以后,大家知道特别是数学建模的理论,一旦数理逻辑建立起来,它就有自恰性和逻辑的科学性,因为它依赖于数学,数学的逻辑是严密的,所以它在一定意义上是正确的,但是有时候,我们看一个理论会发现,当它得到的结论是x和y是正相关关系的时候,我们觉得现实生活中好像不是这样的。那么可能存在的问题就是,既有的理论没有正确地捕捉现实中的这个关系,或者说没有捕捉到x和y的关系中更重要的方面。那我们怎么知道呢?经济学就依赖实证的方法来看x和y到底正相关还是负相关?如果确实是这样,那么就说明既有的理论在很大程度上可能是正确的。在这个层面上,计量经济学、实证研究和理论研究的关系就像实验物理和理论物理一样。

第三就是去发现一些净效应。我们知道,很多理论,特别是现代经济学理论已经非常庞杂,关于变量和变量之间的关系有不同的理论。有的理论认为x和y正相关,有的理论认为它们负相关。大家知道,在做政策的时候就需要知道x和y到底是正相关还是负相关?每一个机制在理论上单独来看可能都是对的,但对于制定政策的人来讲,如果不同的机制所预测的x和y的关系是相反的,那就需要知道,一旦这个政策下去,影响到底是正的还是负的?理论是不能帮我们回答这个问题的。不同的理论得到的方向完全可能是相反的,而且现在的经济学研究在很多问题上都可以想出不同的机制,使得在这个机制下两个变量正相关,在那个机制下负相关,而且做理论的很多人往往喜欢标新立异,大家都认为x和y正相关,他就写一篇paper认为二者负相关,这是在国外发文章的捷径。现代经济学的理论,已经有非常多的理论经济学家在做这样的工作来揭示x和y的关系的不同机制。那我们在看现实世界的时候,就可能被这些理论搞糊涂了,它们到底哪个更重要?这个问题如果离开了计量经济学,我们也没有办法知道净效应到底是正是负?

第四个方面,我们再往前走一步,x和y的关系,x和z的关系,在理论上很清楚,但实证研究能告诉你哪个效应更强。大家知道在做政策的时候,比如有一笔100万的预算,我们就需要考虑这笔钱到底用来干哪件事情?比如,现在国外有个很著名的争论,就是教育的发展至少可以提出两个办法,第一是培训师资,第二就是缩小班级的规模,因为大家认为如果班级大了,每一个学生得到老师的关注就少了,这时候学生的成绩就会下降。那么对于政府来讲,就需要考虑,这100万到底去做哪件事情?且不说师资和学生之间的相关性,班级的规模和学生之间的相关性,到底是正是负,是否显著,这件事情本身就不确定,就算是确定的,政府也需要知道应该把这笔钱花在缩小班级规模上还是提高师资水平上,做哪件事情更划算?所以,我们就必须知道,在大样本的观察下,去做这件事情对学生成绩的提高程度有多大?对计量经济学家来讲,一个非常重要的目标就是要

2

准确地让计量的结果的系数要符合真实的效应的大小,这样就可以把一个计量分析里面的不同政策变量的效应去做比较,这就有利于政策效应的提高和资源配臵效率的提高,有利于改进人类的福利。而这个工作,是理论没有办法告诉我们的事情,理论没有办法告诉我们这个效应到底有多大。

第五,在现代经济学的前沿研究中,更为重要的是去identify这个机制,特别是在很多宏观的研究里面,我本人也做一些宏观的研究,比如做过不平等和增长的研究,有那么多的理论说这两者是负相关的,也有一些理论说是正相关的,我们现在的工作到了哪一步呢?实际上我们是看net effect,在不同的理论机制下,我可以告诉你,二者总体上是负相关的。但是,还有一个很难的工作就是,这个负相关到底是因为什么导致的?实际上在我们的研究里我们是不知道的,但是计量经济学很难做的一个工作就是要告诉大家到底是什么机制在起作用?在理论上可能有好几个机制会告诉你这两者是负相关的,但到底是通过哪一个机制起作用的呢?这个机制的identification的重要性就在于,在做政策的时候,知道对什么样的机制去做政策?而这是非常困难的。因为在收集数据的过程当中,很难区分出这样的机制。特别是在开始做计量还不是很有经验的时候,往往就想去看看x和y之间的关系。在做计量的时候,在收集数据的时候,只考虑x怎么度量,y怎么度量,然后把这数据往机器里一放就可以了,但我们可能很少会去想,x和y之间的中间变量是什么呢?我们可能就会忽略掉这些东西,那最后就没有办法去看到底这些中间机制是什么了,这样就使得研究的档次上不去。而这些工作需要在做实证研究之前,对x到y的各种各样的机制要有一个全面而清楚的了解,并且在做问卷的时候就需要知道,怎么利用一些方法把各种机制独立开,必须要非常清楚地,让大家可以确信地认为你所看到的这个机制是非常干净的。“干净”这个词是一个比较通俗的说法,它是指在我看到的x到y的关系里面,我可以让你确信,就是因为我说的这个机制,而不包含其他的东西,要达到这一点就有很多的方法。

第二个我要讲的问题是,我们处在经济学发展的历史当中的一个什么样的时点呢?我要跟大家讲的第一点就是,经济学整个理论分析的架构已经基本上完善了,这意味着在经济学理论的进展上已经很难有重大突破,这就使得实证研究成为全世界研究的潮流的一个重要原因。我这里要提到陈志俊,他是做产业组织理论的,学物理出身的。我想我刚才讲的这句话可能从我嘴里讲出来你们不太信,因为我现在很多工作是在做实证。他上学期来复旦,seminar完了之后我们在一起吃饭时他就讲,经济学的发展已经差不多了,所以大家现在就该用了,他说了这样一句话,“有的时候我觉得数学太好是害人的”。这句话特别值得数学好的同学去琢磨。

第二点,在有一些研究领域里面,我们有太多的理论,但是经验的证据不足,而这些研究领域里面,现在前沿的领域往往由实证研究所推动。那么有一些什么样的领域呢?我等会儿还会反复再讲到这几个,第一个比如说IO,经验的IO现在成为了IO研究的前沿领域。还有一个很有代表性的研究领域,就是personnel economics,人事管理经济学,现在也是经验的研究非常热。

第三个方面就是,应用的微观和政策的评估。现在在全世界范围之内,政府的公共部门都非常庞大,而且如果看政府的公共开支在GDP中的比重,它在发达国家中是上升的,那么大量的公共开支到哪些地方去了呢?到labor market, health, education这几个领域里,在这些领域就碰到我刚讲的问题,一个政策下去到底有没有效果?哪个政策效果更大?政府也希望了解这个。比如我刚讲到小班

3

的例子,这是一个非常好的例子,我也很喜欢举这个例子,在美国,每年有巨额资金投入到缩小班级规模这件事情上。因为大家知道,班级规模缩小需要增加师资、教室、硬件,所以联邦政府州政府把大量的钱投在里面,但这件事情是不是真的像我们想象的那样会改进学生的成绩呢?这是不一定的,因为在一个有选择的社会里面,如果要是有一个班是小班,一个班是大班,大家马上就想到,谁会去选择读小班?往往就是富人,因为他有钱,还有就是父母的教育程度高的家庭也会觉得小班好,所以就会让孩子去读小班,于是就会看到小班的成绩好。但是小班的成绩好是不是因为父母有钱呢?是不是因为父母的学习成绩就比较好呢?还是因为班级规模缩小导致的呢?所以凭我们的肉眼观察到的,小班的同学成绩好,这不说明任何问题。如果这个政策没有效果,你要知道,给政府节省下来的钱,不知道可以造多少航空母舰了。那么在这样的研究里面,政策评估所起到的对于人类福利的改进,对于社会价值的创造就远远大于一个单纯的理论研究。

所以,为什么应用的研究和政策的评估如此之重要?很多人觉得文科好像没什么用,文科就是大家拍拍脑袋,想想idea就可以了。现在的实证研究已经可以为增进社会福利,提高资源的有效性,起到非常重要的作用。那么反过来看中国,我一直讲的一句话就是,有政策无评估,我们做了大量的政策,我们有没有评估?我们知道不知道这些政策有没有效果?我们不知道。

在经济学最近十年左右的时间里面,有一场新的热潮出现在三个领域,我也一直在讲,一个是比较经济学,一个是政治经济学,实际上是新的政治经济学,还有就是社会经济学。我这里特别要强调比较经济学和新政治经济学。新的政治经济学的一个新的研究方向,就是要去看各个国家的政治结构和政治制度对每一个国家的经济增长和绩效有什么样的影响,所以新的政治经济学的兴起,本身就带有比较的视角,那么这就马上带来一个问题,是不是不同国家的社会和政治结构对经济的绩效和增长有不同的影响?这个问题首先是一个实证问题。因为在理论发展之前,我们首先要确认的就是我刚才讲的这个事实,如果它不能被确认,那就不要去做理论了,就无所谓我们讲的comparative economics 或者new political economics了。

大家现在学经济学理论,学微观宏观理论的时候,你们会在你们的教科书上看到很多诺贝尔奖得主的名字,于是大家就有一个误解,就觉得这些代表了经济学的前沿方向,代表了主流经济学的研究方向。我要提醒大家的是,你们在微观宏观里面,特别是在公共课里面的微观宏观,而不是专业的微观宏观seminar或workshop里面所学到的,都至少是二十年前的东西。因为诺贝尔奖通常都授予二三十年前的成果。你们更应该关注克拉克奖,去看看克拉克奖得主最近在做什么东西,看看那些在世界经济学界处在最前沿位臵的人在做什么东西。我列举几个名字给大家听听,这些人我不能说他们是做实证研究的,但是我必须要说他们大多是既做理论也做实证的,而最近的工作很多集中在实证上面。有些什么样的人呢?Murphy, 现在在Chicago, Becker 的学生。Levitt,前几届克拉克奖的得主,他很有趣,他在读博士的时候有个笑话,他上课上到微观经济学的时候,问他的同学什么叫全导数?他的同学看着他说,你死定了。可是就这样一个人最后得到克拉克奖。他的工作完全是实证,待会儿我会举到他的例子,比如他会去看堕胎和犯罪之间有什么样的关系?还有政治商业周期在实证上是否可以证实?再接下来的两个人现在都大名鼎鼎了,我估计未来也可能是诺贝尔奖得主。Shleifer和Acemoglu,这两个人一个在哈佛,一个在MIT,而且这两个人都是研究理论

4