不知从何时起解答计量问题成叻我日常生活的一部分。天南海北的读者与同道提出了各种各样的计量问题这里摘取少量的典型问题,希望对从事实证研究的朋友有帮助
1、在什么情况下,应将变量取对数再进行回归
答:可以考虑以下几种情形。
第一如果理论模型中的变量为对数形式,则应取对数比如,在劳动经济学有哪些常见问题中研究教育投资回报率的决定因素通常以工资对数为被解释变量,因为这是从Mincer模型推导出来的
苐二,如果变量有指数增长趋势(exponential growth)比如 GDP,则一般取对数使得 lnGDP 变为线性增长趋势(linear growth)。第三如果取对数可改进回归模型的拟合优度(比如
R2或显著性),可考虑取对数
第四,如果希望将回归系数解释为弹性或半弹性(即百分比变化)可将变量取对数。
第五如果无法确定是否该取对数,可对两种情形都进行估计作为稳健性检验(robustnesscheck)。若二者的回归结果类似则说明结果是稳健的。
2、如何理解线性囙归模型中交互项(interactive term)系数的经济意义?
答:在线性回归模型中如果不存在交互项或平方项等非线性项,则某变量的回归系数就表示該变量的边际效应(marginal effect)比如,考虑回归方程
其中 u为随机扰动项。显然变量x对 y 的边际效应为 2,即 x 增加一单位平均而言会使 y增加两单位。考虑在模型中加入交互项比如
其中, x 与 z为解释变量而 xz为其交互项(交叉项)。由于交互项的存在故x对 y 的边际效应(求偏导数)為β + δz,这说明 x对 y的边际效应并非常数而依赖于另一变量z
的取值。如果交互项系数 δ为正数则 x对 y的边际效应随着 z 的增加而增加(比如,劳动力的边际产出正向地依赖于资本);反之如果δ为负数,则 x对 y的边际效应随着z的增加而减少
3、在一些期刊上看到回归模型中引叺控制变量。控制变量究竟起什么作用应该如何确定控制变量呢?
答:在研究中通常有主要关心的变量,其系数称为 “parameterof interest” 但如果只對主要关心的变量进行回归(极端情形为一元回归),则容易存在遗漏变量偏差(omittedvariable
bias)即遗漏变量与解释变量相关。加入控制变量的主要目的就是为了尽量避免遗漏变量偏差,故应包括影响被解释变量 y 的主要因素(但允许遗漏与解释变量不相关的变量)
4、很多文献中有 “稳健性检验” 小节,请问是否每篇实证都要做这个呢具体怎么操作?
答:如果你的论文只汇报一个回归结果别人是很难相信你的。所以才需要多做几个回归,即稳健性检验(robustness
checks)没有稳健性检验的论文很难发表到好期刊,因为不令人信服稳健性检验方法包括变换函数形式、划分子样本、使用不同的计量方法等,可以参见我的教材更重要的是,向同领域的经典文献学习并模仿其稳健性检验的做法。
5、对于面板数据一定要进行固定效应、时间效应之类的推敲么?还是可以直接回归我看到很多文献,有的说明了使用固定效应模型的原因有的则直接回归出结果,请问正确的方法是什么
答:规范的做法需要进行豪斯曼检验(Hausman test),在固定效应与随机效应之间进行選择但由于固定效应比较常见,而且固定效应模型总是一致的(随机效应模型则可能不一致)故有些研究者就直接做固定效应的估计。
对于时间效应也最好同时考虑比如,加入时间虚拟变量或时间趋势项;除非经过检验发现不存在时间效应。如果不考虑时间效应則你的结果可能不可信(或许x与 y的相关性只是因为二者都随时间而增长)。
6、如何决定应使用二阶段最小二乘法(2SLS)还是广义矩估计(GMM)
答:如果模型为恰好识别(即工具变量个数等于内生变量个数),则GMM完全等价于2SLS故使用2SLS就够了。在过度识别(工具变量多于内生变量)的情况下GMM的优势在于,它在异方差的情况下比2SLS更有效率由于数据或多或少存在一点异方差,故在过度识别情况下一般使用GMM。
7、在媔板数据中感兴趣的变量x 不随时间变化,是否只能进行随机效应的估计(若使用固定效应则不随时间变化的关键变量 x
答:通常还是使鼡固定效应模型为好(当然,可进行正式的豪斯曼检验以确定使用固定效应或随机效应模型)。如果使用固定效应有两种可能的解决方法:
(1)如果使用系统GMM估计动态面板模型,则可以估计不随时间而变的变量x 的系数
(2)在使用静态的面板固定效应模型时,可引入不隨时间而变的变量 x与某个随时间而变的变量 z 之交互项并以交互项 xz (随时间而变)作为关键解释变量。
8、对于非平稳序列能否进行格兰傑因果检验?
答:如果非平稳序列之间存在协整关系则可进行格兰杰因果检验(Grangercausality test)。这是因为根据“格兰杰表示法定理”(Granger Representation Theorem),任何協整系统都可写为向量自回归(VAR)模型即格兰杰因果检验的形式。
反之如果非平稳序列之间不存在协整关系,则须先将原序列变为平穩过程(比如一阶差分)然后再进行格兰杰因果检验;否则会出现“伪回归”(spuriousregression)问题。
9、对于面板数据如何进行格兰杰因果检验?
答:在对面板数据进行格兰杰因果检验时由于被解释变量(dependentvariable)的滞后项作为解释变量(explanatory variable)出现在方程右边,故为动态面板模型(dynamic panel)应使用差分GMM或系统GMM进行估计,详见陈强(2015
陈强老师十一北京‘’高级计量经济学有哪些常见问题与stata‘’现场培训
提供专用讲义,面对面跟陳老师学习
2016年最后一场陈强老师培训
培训地点:北京市海淀区首都体育学院
培训费用:3600元 /3000元 (仅限全日制本科生和硕士研究生)
陈强分别于1992姩与1995年获得北京大学经济学有哪些常见问题学士与硕士学位,2007年获美Northern Illinois University数学硕士与经济学有哪些常见问题博士学位现任山东大学经济学有哪些常见问题院教授,泰岳经济研究中心副主任(主持工作)
主要研究领域为发展经济学有哪些常见问题、计量经济学有哪些常见问题忣经济史。
独立编著的经典教材《高级计量经济学有哪些常见问题及Stata应用》第二版于2014年由高教出版社出版
2010年入选教育部新世纪优秀人才支持计划。
掌握高级计量经济学有哪些常见问题的核心方法及Stata操作不再茫然,知其然而知其所以然迅速成为处理数据及定量分析的高掱。
直观地解释高级计量经济学有哪些常见问题方法通过案例学习相应的Stata操作,深入浅出地介绍实证分析与论文写作的精髓
课程PPT、数據集及相关论文。
由于学员的基础不同本课程仅对学员背景做最低要求,即假设学员知道概率统计及少量线性代数但不要求学过计量經济学有哪些常见问题或Stata操作。因为“大道至简至易”初级计量与高级计量的本质是一样的,学子们最需要的是能够直指人心地洞明计量原理与操作工具然后得心应手地用于实战(而非完成习作)。
着重介绍小样本与大样本OLS以及相应的普通标准误、异方差稳健标准误、聚类稳健标准误、异方差自相关稳健标准误、自助标准误等。深切理解OLS的原理与适用条件是一切计量原理的基础。
及时地介绍Stata知识鉯OLS在Stata的实现作为入门,体会Stata的简单与强大
介绍解决内生性的诸多利器,如工具变量法(2SLS与GMM)、随机与自然实验、双重差分法、倾向得分匹配等由于双向因果、遗漏变量、度量误差的普遍存在,内生性是实证研究的常见难题这也凸显了解决内生性在实践中的重要性。
介紹在微观经济学有哪些常见问题(比如企业、家庭)研究中常见的计量方法包括二值与多值选择、排序与计数模型、断尾归并回归、样夲选择模型等。
介绍静态面板包括固定效应、随机效应、时间效应等。面板数据由于能控制个体异质性(heterogeneity)缓解遗漏变量偏差,在实踐中越来越重要;而静态面板则是最常见的面板
介绍动态面板与非线性面板,包括面板工具变量法、差分GMM、系统GMM、面板二值选择模型、媔板计数模型等其应用也日益广泛。
介绍在宏观经济学有哪些常见问题与金融学中常见的时间序列方法包括ARMA,ADLVAR,单位根与协整等
鉯经典论文为例,介绍实证研究步骤与论文写作从如何选题、查找文献、数据收集,到使用合适的计量方法编写Stata程序,到论文写作、seminar演讲、投稿修改等各环节技巧
现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;
PS:根据缴费顺序安排座位
点击“阅读原文”,茬线提交报名信息;
开课前一周发交通住宿指南和课程资料
阅读原文,即报名链接: