stata软件怎么表示0-79和80+

stata基本命令_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
stata基本命令
s​t​a​t​a​ ​软​件​应​用
阅读已结束,如果下载本文需要使用
想免费下载本文?
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢79我常用到的stata命令
上亿文档资料,等你来发现
79我常用到的stata命令
我常用到的stata命令1;最重要的两个命令莫过于help和search了;闲话不说了;下面该正式处理数据了;为了使do文件能够顺利工作,一般需要编辑do文件;/*(标签;captureclear(清空内存中的数据);capturelogclose(关闭所有打开的日;setmem128m(设置用于stata使用的内;setmoreoff(关闭more选项;s
我常用到的stata命令1最重要的两个命令莫过于help和search了。即使是经常使用stata的人也很难,也没必要记住常用命令的每一个细节,更不用说那些不常用到的了。所以,在遇到困难又没有免费专家咨询时,使用stata自带的帮助文件就是最佳选择。stata的帮助文件十分详尽,面面俱到,这既是好处也是麻烦。当你看到长长的帮助文件时,是不是对迅速找到相关信息感到没有信心?闲话不说了。help和search都是查找帮助文件的命令,它们之间的区别在于help用于查找精确的命令名,而search是模糊查找。如果你知道某个命令的名字,并且想知道它的具体使用方法,只须在stata的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。如果你想知道在stata下做某个估计或某种计算,而不知道具体该如何实现,就需要用search命令了。使用的方法和help类似,只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。在列表中寻找最相关的内容,点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找,反复实验,通常可以较快地找到你需要的内容。下面该正式处理数据了。我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。因为很少有一项实证研究能够一次完成,所以,当你下次继续工作时。能够重复前面的工作是非常重要的。有时因为一些细小的不同,你会发现无法复制原先的结果了。这时如果有记录下以往工作的do文件将把你从地狱带到天堂。因为你不必一遍又一遍地试图重现做过的工作。在stata窗口上部的工具栏中有个孤立的小按钮,把鼠标放上去会出现“bring do-file editor to front”,点击它就会出现do文件编辑器。为了使do文件能够顺利工作,一般需要编辑do文件的“头”和“尾”。这里给出我使用的“头”和“尾”。/*(标签。简单记下文件的使命。) */capture clear
(清空内存中的数据)capture log close
(关闭所有打开的日志文件)set mem 128m
(设置用于stata使用的内存容量)set more off
(关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出。)set matsize 4000
(设置矩阵的最大阶数。我用的是不是太大了?)cd D:
(进入数据所在的盘符和文件夹。和dos的命令行很相似。)
log using (文件名).log,replace (打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果。)use (文件名),clear
(打开数据文件。)(文件内容)log close
(关闭日志文件。)exit,clear
(退出并清空内存中的数据。)这个do文件的“头尾”并非我的发明,而是从沈明高老师那里学到的。版权归沈明高老师。(待续) 我常用到的stata命令2实证工作中往往接触的是原始数据。这些数据没有经过整理,有一些错漏和不统一的地方。比如,对某个变量的缺失观察值,有时会用点,有时会用-9,-99等来表示。回归时如果使用这些观察,往往得出非常错误的结果。还有,在不同的数据文件中,相同变量有时使用的变量名不同,会给合并数据造成麻烦。因此,拿到原始数据后,往往需要根据需要重新生成新的数据库,并且只使用这个新库处理数据。这部分工作不难,但是非常基础。因为如果在这里你不够小心,后面的事情往往会白做。假设你清楚地知道所需的变量,现在要做的是检查数据、生成必要的数据并形成数据库供将来使用。检查数据的重要命令包括codebook,su,ta,des和list。其中,codebook提供的信息最全面,缺点是不能使用if条件限制范围,所以,有时还要用别的帮帮忙。su空格加变量名报告相应变量的非缺失的观察个数,均值,标准差,最小值和最大值。ta空格后面加一个(或两个)变量名是报告某个变量(或两个变量二维)的取值(不含缺失值)的频数,比率和按大小排列的累积比率。des后面可以加任意个变量名,只要数据中有。它报告变量的存储的类型,显示的格式和标签。标签中一般记录这个变量的定义和单位。list报告变量的观察值,可以用if或in来限制范围。所有这些命令都可以后面不加任何变量名,报告的结果是正在使用的数据库中的所有变量的相应信息。说起来苍白无力,打开stata亲自实验一下吧。顺带说点儿题外话。除了codebook之外,上述统计类的命令都属于r族命令(又称一般命令)。执行后都可以使用return list报告储存在r()中的统计结果。最典型的r族命令当属summarize。它会把样本量、均值、标准差、方差、最小值、最大值、总和等统计信息储存起来。你在执行su之后,只需敲入return list就可以得到所有这些信息。其实,和一般命令的return命令类似,估计命令(又称e族命令)也有ereturn命令,具有报告,储存信息的功能。在更复杂的编程中,比如对回归分解,计算一些程序中无法直接计算的统计量,这些功能更是必不可少。检查数据时,先用codebook看一下它的值域和单位。如果有-9,-99这样的取值,查一下问卷中对缺失值的记录方法。确定它们是缺失值后,改为用点记录。命令是replace (变量名)=. if (变量名)==-9。再看一下用点记录的缺失值有多少,作为选用变量的一个依据。得到可用的数据后,我会给没有标签的变量加上注解。或者统一标签;或者统一变量的命名规则。更改变量名的命令是ren (原变量名)空格(新变量名)。定义标签的命令是label var (变量名)空格”(标签内容)”。整齐划一的变量名有助于记忆,简明的标签有助于明确变量的单位等信息。如果你需要使用通过原始变量派生出的新变量,那么就需要了解gen,egen和replace这三个命令。gen和replace常常在一起使用。它们的基本语法是gen (或replace)空格(变量名)=(表达式)。二者的不同之处在于gen是生成新变量,replace是重新定义旧变量。虚拟变量是我们常常需要用到的一类派生变量。如果你需要生成的虚拟变量个数不多,可以有两种方法生成。一种是简明方法:gen空格(变量名)=((限制条件))[这外面的小括弧是命令需要的,里面的小括弧不是命令需要的,只是说明“限制条件”并非命令]。如果某个观察满足限制条件,那么它的这个虚拟变量取值为1,否则为0。另一种要麻烦一点。就是gen (变量名)=1 if (取值为一限制条件)replace(相同的变量名)=0 if (取值为零的限制条件)两个方法貌似一样,但有一个小小的区别。如果限制条件中使用的变量都没有任何缺失值,那么两种方法的结果一样。如果有缺失值,第一种方法会把是缺失值的观察的虚拟变量都定义为0。而第二种方法可以将虚拟变量的取值分为三种,一是等于1,二是等于0,三是等于缺失值。这样就避免了把本来信息不明的观察错误地纳入到回归中去。下次再讲如何方便地生成成百上千个虚拟变量。 我常用到的stata命令3大量的虚拟变量往往是根据某个已知变量的取值生成的。比如,在某个回归中希望控制每个观察所在的社区,即希望控制标记社区的虚拟变量。社区数目可能有成百上千个,如果用上次的所说的方法生成就需要重复成百上千次,这也太笨了。大量生成虚拟变量的命令如下;ta (变量名), gen((变量名))第一个括号里的变量名是已知的变量,在上面的例子中是社区编码。后一个括号里的变量名是新生成的虚拟变量的共同前缀,后面跟数字表示不同的虚拟变量。如果我在这里填入d,那么,上述命令就会新生成d1,d2,等等,直到所有社区都有一个虚拟变量。在回归中控制社区变量,只需简单地放入这些变量即可。一个麻烦是虚拟变量太多,怎么简单地加入呢?一个办法是用省略符号,d*表示所有d字母开头的变量,另一法是用破折号,d1-d150表示第一个到第150个社区虚拟变量(假设共有150个社区)。还有一种方法可以在回归中直接控制虚拟变量,而无需真的去生成这些虚拟变量。使用命令areg可以做到,它的语法是areg (被解释变量) (解释变量), absorb(变量名)absorb选项后面的变量名和前面讲的命令中第一个变量名相同。在上面的例子中即为社区编码。回归的结果和在reg中直接加入相应的虚拟变量相同。生成变量的最后一招是egen。egen和gen都用于生成新变量,但egen的特点是它更强大的函数功能。gen可以支持一些函数,egen支持额外的函数。如果用gen搞不定,就得用egen想办法了。不过我比较懒,到现在为止只用用取平均、加和这些简单的函数。有的时候数据情况复杂一些,往往生成所需变量不是非常直接,就需要多几个过程。曾经碰到原始数据中记录日期有些怪异的格式。比如,日被记录为。我想使用它年份和月份,并生成虚拟变量。下面是我的做法:gen yr=int(date)gen mo=int((data-yr*1)ta yr, gen( yd)ta mo, gen( md)假设你已经生成了所有需要的变量,现在最重要的就是保存好你的工作。使用的命令是save空格(文件名),replace。和前面介绍的一样,replace选项将更新你对数据库的修改,所以一定要小心使用。最好另存一个新的数据库,如果把原始库改了又变不回去,就叫天不应叫地不灵了。 我常用到的stata命令4前面说的都是对单个数据库的简单操 作,但有时我们需要改变数据的结构,或者抽取来自不同数据库的信息,因此需要更方便的命令。这一类命令中我用过的有:改变数据的纵横结构的命令 reshape,生成退化的数据库collapse,合并数据库的命令append和merge。 纵列(longitudinal)数据 通常包括同一个行为者(agent)在不同时期的观察,所以处理这类数据常常需要把数据库从宽表变成长表,或者相反。所谓宽表是以每个行为者为一个观察,不同时期的变量都记录在这个观察下,例如,行为者是厂商,时期有年,变量是雇佣人数和所在城市,假设雇佣人数在不同时期不同,所在城市 则不变。宽表记录的格式是每个厂商是一个观察,没有时期变量,雇佣人数有两个变量,分别记录2000年和2001年的人数,所在城市只有一个变量。所谓长 表是行为者和时期共同定义观察,在上面的例子中,每个厂商有两个观察,有时期变量,雇佣人数和所在城市都只有一个,它们和时期变量共同定义相应时期的变量取值。在上面的例子下,把宽表变成长表的命令格式如下:reshape long (雇佣人数的变量名), i((标记厂商的变量名)) j((标记时期的变量名)) 因为所在城市不随时期变化,所以在转换格式时不用放在reshape long后面,转换前后也不改变什么。相反地,如果把长表变成宽表则使用如下命令reshape wide (雇佣人数的变量名), i((标记厂商的变量名)) j((标记时期的变量名)) 唯一的区别是long换成了wide。collapse的用处是计算某个数据库的一些统计量,再把它存为只含有这些统计量的数据库。用到这个命令的机会不多,我使用它是因为它可以计算中位数和从1到99的百分位数,这些统计量在常规的数据描述命令中没有。如果要计算中位数,其命令的语法如下 collapse (median) ((变量名)), by((变量名))生成的新数据库中记录了第一个括号中的变量(可以是多个变量)的中位数。右面的by选项是根据某个变量分组计算中位数,没有这个选项则计算全部样本的中位数。合并数据库有两种方式,一种是增加观察,另一种是增加变量。第一种用append,用在两个数据库的格式一样,但观察不一样,只需用append空格 using空格(文件名)就可以狗尾续貂了。简单明了,不会有什么错。另一种就不同了,需要格外小心。如果两个数据库中包含共同的观察,但是变量不同,希 望从一个数据库中提取一些变量到另一个数据库中用merge。完整的命令如下:use (文件名) [打开辅助数据库]sort (变量名) [根据变量排序,这个变量是两个数据库共有的识别信息]save (文件名), replace [保存辅助数据库]use (文件名) [打开主数据库]sort (变量名) [对相同的变量排序]merge (变量名) using (文件名), keep((变量名))[第一个变量名即为前面sort后面的变量名,文件名是辅助数据库的名字,后面的变量名是希望提取的变量名]ta _merge [显示_merge的取值情况。_merge等于1的观察是仅主库有的,等于2的是仅辅助库有的,等于3是两个库都有的。]drop if _merge==2 [删除仅仅来自辅助库的观察]drop merge [删除_merge]save (文件名), replace [将合并后的文件保存,通常另存] 我常用到的stata命令5讲到这里似乎对于数据的生 成和处理应该闭嘴了。大家可能更想听听估计、检验这些事情。但我并不想就此止住,因为实际中总是有一些简单套用命令无法轻易办到的特殊要求。此时至少有两 条路可以通向罗马:一是找到更高级的命令一步到位;二是利用已知简单命令多绕几个圈子达到目的。下面讲一个令我刻骨铭心的经历,这也是迄 今我所碰到的生成新数据中最繁复的了。原始数据中包含了可以识别属于同一个家庭中所有个人的信息和家庭成员与户主关系的信息。目的是利用这些信息建立亲子 关系。初步的构想是新数据库以子辈为观察,找到他们的父母,把父母的变量添加到每个观察上。我的做法如下:use a1,clear [打开全部样本数据库]keep if gender==2&agemos&=96&a8~=1&line&10[保留已婚的一定年龄的女性]replace a5=1 if a5==0[变量a5标记和户主的关系。等于0是户主,等于1是户主的配偶。这里不加区分地将户主及其配偶放在一起。]keep if a5==1|a5==3|a5==7[保留是户主(=1),是户主的子女(=3),或是户主的儿媳(=7)的那些人。] ren h hf [将所需变量加上后缀f,表示女性]ren line lf [将所需变量加上后缀f,表示女性]sort wave hhidsave b1,replace [排序并保存]keep if a5f==1 [留下其中是户主或户主配偶的]save b2,replace [保存]use b1,clearkeep if a5f==3|a5f==7save b3,replace [留下其中是户主女儿或儿媳的并保存]use a3,clear [打开与户主关系是户主子女的儿童数据库]sort wave hhidmerge wave hhid using CHNS01b2, keep(hf lf)ta _mergedrop if _merge==2sort hhid line wave [处理两代户,将户主配偶女性库与儿童库合并]by hhid line wave: egen x=count(id)drop x _merge [计算每个年份家庭匹配的情况,x只取值1,表明两代户匹配成功] save b4,replace [保存]use a4,clear [打开与户主关系是户主孙子女的儿童数据库]sort wave hhidmerge wave hhid using CHNS01b3, keep(a5f a8f schf a12f hf agemosf c8f lf) ta _mergedrop if _merge==2 [处理三代户,将户主女儿或儿媳女性库与孙子女儿童库合并] sort hhid line waveby hhid line wave: egen x=count(id)gen a=agemosf-agemosdrop if a&216&x==3 [计算每个年份家庭匹配的情况,x不只取1,三代户匹配不完全成功。删除不合理的样本,标准是年龄差距和有三个可能母亲的那些家庭。]gen xx=x[_n+1]gen xxx=x[_n-1]gen y=lf if x==1replace y=lf[_n+1] if x==2&xx==1replace y=lf[_n-1] if x==2&xxx==1keep if x==1|(lf==y&x==2)[对于有两个可能母亲的儿童,有相同编码的女性出现两次的情况。上面的做法是为了保证不删除这部分样本。]drop a x xx xxx y _mergesave b5,replace [保存合并后的数据库][对男性数据的合并完全类似,不赘述。]log closeexit,clear我的方法是属于使用简单命令反复迂回地达到目的那一类的,所以非常希望有更简便的方法来替代。不过做实证时往往不是非常追求程序的漂亮,常常也就得过且过 了。曾经有人向我索要过上面的处理方法,因为一直杂事缠身,就没有回复。现在公开了,希望对需要的人能有所帮助,我也懒得再去一一答复了。 我常用到的stata命令6stata强大的功能体现在它可以方便地回归微观数据。而回归也是微观实证中最重要的方法。下面就开始讲stata中和回归有关的常用命令。基本回归方法有两种:线性设定下的最小二乘法(OLS)和两阶段最小二乘法(2SLS)。他们在实证分析中应用广泛,十分详细地掌握这两种方法是实证研究的基本要求。讲解的顺序是先依次介绍如何在stata中实现OLS和2SLS估计,然后再分析如何在实际问题中选择合理的方法。后一部分受Joshua Angrist教授的影响很大,因此,在后面引用他的思想时会详细注明。假设你已经清楚地了解待估计方程的形式,那么回归命令的基本格式就十分简单明了: reg (被解释变量) (解释变量1) (解释变量2)??方程中的相应变量可以简单地放在reg的后面。执行上面的命令后,stata会出现两个表格,分别报告一些方差分析和回归的参数估计结果。我们最关心的是参数的大小和显著性,这在第二个表格中列出。表格的最左边一栏列出了解释变量,在它的右边是相应的系数估计值,然后依次是估计值的标准误,t比率,原假设为系数的真实值等于零时错误地拒绝该假设的概率――p值,以及该估计值的置信度为(1-5%)的置信区间。我看到回归结果的第一眼是瞄着最关心的解释变量的符号、大小和显著性。看看解释变量影响的方向和大小是不是符合理论的预期,是不是合乎常识,以及这个估计值是不是显著。标记显著性的统计量是t统计量,在经典假设下,它服从t分布。t分布和标准正态分布形状很相似,但它的“尾巴”要比标准正态分布的“肥”一些,在样本量比较小的时候尤其明显,当样本量趋于无穷时,t分布的极限分布是标准正态分布。大家对标准正态分布的分布函数上一些关键点比较熟悉,比如,1.96是97.5%的关键点,1.64是95%的关键点,所以,我们希望知道什么时候可以安全地使用标准正态分布。下表列出了一些小自由度下二者的差异(Beyer 1987 “CRC Standard Mathematical Tables, 28th ed.”;Goulden 1956 “Methods of Statistical Analysis, 2nd ed.”)。可以看出,自由度超过一百时,二者的差别就已经相当小了。所以,当样本量的数量级是100个或以上时,可以直接认为t比率服从标准正态分布,并以此做检验。90%
9.92484包含各类专业文献、应用写作文书、生活休闲娱乐、中学教育、专业论文、外语学习资料、幼儿教育、小学教育、各类资格考试、79我常用到的stata命令等内容。 
 stata常用命令我常用到的 stata 命令 最重要的两个命令莫过于 help 和 search 了。即使是经常使用 stata 的人也很难,也没必...  常用Stata命令_IT/计算机_专业资料。我常用到的 stata 命令 1 最重要的两个命令莫过于 help 和 search 了。 即使是经常使用 stata 的人也很难, 也没 必要记住...  stata命令集 9页 1下载券 我常用到的stata命令集 11页 免费 喜欢此文档的还...表 1.为某一降压药临床试验数据,试从键盘输入 Stata,并保存为 Stata 格式文件...  可通用于 xtgls 和 fe 之后 /cheerhappywo/blog/item/bd9f2f96a5dfb40ad21b70b0.h tml 我常用到的 stata 命令 最重要的两个命令莫过于 ...  culture sci health admin techno, panels(hetero) corr(ar1),修正异方差和一阶序列相关 ar(1) 我常用到的 stata 命令 最重要的两个命令莫过于 help 和 ...  STATA 讲义 77页 2财富值 常用到的STATA命令 11页 1财富值 stata常用命令 22页 5财富值 STATA命令分类列表 15页 免费 我常用到的stata命令集 11页 免费搜...  我常用到的stata命令集 11页 免费Stata命令 ...使用 tabulate,sum 命令描述数据 Table urban girl,sum(height) (四) 期望值 ...  必须记住的常用命令请记住下面这些常用的基本命令。记住这些命令之后,当不知其...STATA 格式的数据文件 将内存中的数据压缩 保存内存中的数据 录入数据 编辑数据...  Stata常用命令_计算机软件及应用_IT/计算机_专业资料。Stata 常用命令 回归命令有...我常用到的stata命令集 11页 免费 STATA 讲义 77页 1下载券 Stata教学 74页...第二章 例 2.1.1(p24) .(1)表 2.1.2 中 E(Y|X=800)即条件均值的求法,将数据直接复制到 stata 中。 程序: sum y if x==800Variable Obs Mean Std. Dev. Min Max y 4 605 34.8其他条件均值求法程序相同, sum 是
summarize 的缩写(横线表示 最简省形式) 显示变量的描述统 , 计信息,包括:观测量数,均值, 标准差,最小值,最大值,if 是 条件表达式。程序: sum y if x==1100Variable Obs Mean Std. Dev. Min Max y 6 825 121.698 638 968程序: sum y if x==1400Variable Obs Mean Std. Dev. Min Max y 11 1 869 1210(2)图 2.1.1 的做法: 程序:twoway(scatter y x )(lfit y x ),title(&不同可支配收入水平组家庭消费支出的条件 分 布 图 &)xtitle(& 每 月 可 支 配 收 入 ( 元 ) &)ytitle(& 每 月 消 费 支 出 ( 元 ) &)xtick(500(500)4000)ytick(0(500)3500) Scatter 表示散点图选项, lfit 表示回归线, 表示 title 题 目 , xtick 表 示 刻 度 , (500(500)4000)分别 表示起始刻度,中间数表 示以单位刻度, 4000 表示 最后的刻度。要注意的是 命令中的符号都要用英 文字符,否则命令无效。 这个图可以直接复制的, 但是由于我的软件出问 题,只能直接剪切,所以 影响清晰度。2.3. p37) 例 2.3.1(p37)将数据直接复制到 stata 中 程序: (1) total xiyiT ota l S td. E rr. x iy ireturn list scalars: r(skip) r(first) r(k_term) r(k_operator) r(k) r(k_level) r(output) r(b) r(se) a=r(b) g a=r(b) in 1 total xi2 = = = = = = = = =[9 5% Co nf. I nte rv al] 1 563 82 2 83 85 6784 97 475 0150 78 210 1 0 0 0 0 1 63Total 表示求和,return list 命令可以引用其中的数据, 接下来在第一列生成一个 新的变量代表 xiyi 的和, 同 样生成一个 b 代表 xi 平方 的, 除以 b 即可得到 bata a return list g b=r(b) in 1 di a/b .67 (2) mean Yigen m=r(b) in 1 mean Xig n=r(b) in 1 mdi m-n*0.67 142.4 由此得到回归方程:Y=142.4+0.67Xi2.6. 例 2.6.2(p53)程序: (1)回归reg y x (2) 求 X 的样本均值和样本方差 的样本均值和样本方差:mean xM ean es timat ion Mea n x 1
Number of o bs St d. Err . 59 1.7041 = 31[95% Conf. Interv al] 172 .11sum x ,d(d 表示 detail 的省略,这个命令会产生更多的信息) 的省略,这个命令会产生更多的信息) (x 1% 5% 10% 25% 50% 75% 90% 95% 99% P er ce n ti le s 88 7 1. 27 89 2 0. 59 90 0 0. 35 9 2 67 .7 98 9 8. 75 1 21 9 2. 24 1 60 1 5. 58 1 99 7 7. 52 2 06 6 7. 91 La rg e st 1 60 15 . 58 18 26 5 .1 1 99 77 . 52 2 06 67 . 91 S ma ll e st 88 71 . 27 89 20 . 59 89 41 . 08 90 00 . 35O bs S um o f W gt . M ea n S td . D ev . V ar ia n ce S ke wn e ss K ur to s is31 31 11 3 63 .6 9 32 9 4. 46 9 1. 0 9e +0 7 1. 6 91 97 3 4. 7 39 26 7dir(Var)(特别注意 Var 的大小写) (特别注意 大小写) 例 2.6.2(P56) ( ) (1)reg Y X )S o ur c e M od e l Re s i du a l T ot a l Y X _ co n s SS 2 .4 8 1 9e + 0 9 3 02 5 9 02 3 . 9 2 .5 1 2 2e + 0 9 C oe f . .4 3 7 52 6 8 20 9 1 .2 9 5 df 1 27 28 MS 2 . 4 81 9 e + 09 1 1 2 07 0 4 . 59 8 9 7 20 2 1 9 .8 t 4 7 .0 6 6 .2 4 P & |t | 0 . 00 0 0 . 00 0 N u m be r o f o b s F( 1, 27) Prob & F R - s qu a r e d A d j R - s q ua r e d Root MSE = 29 = 22 1 4 .6 0 = 0 . 0 00 0 = 0 . 9 88 0 = 0 . 9 87 5 = 1 0 5 8. 6S td . Er r . . 00 9 2 97 3 33 4 . 98 7[9 5 % Co n f . I n te r v al ] .4 1 8 4 50 3 14 0 3 . 95 9 . 45 6 6 03 3 2 77 8 . 63 2的绘制: (2)图 2.6.1 的绘制: ) twoway (line Y X year),title(&中国居民可支配总收入 X 与消费总支出 Y 的变动图 的变动图&) 中国居民可支配总收入
第三章 例 3.2.2(p72) ( )reg Y X1 X2Sou rc e Mo de l Re sid ua l To ta l Y X1 X2 _c on s SS 1 669 71 98 8 41 700 92 .2 7 1 711 42 08 1 C oe f. . 555 64 38 . 250 08 54 1 43. 32 66 df 2 28 30 MS 8 348 59 94 .2 1 489 31 .8 67 5 704 73 6. 02 t 7 .38 2 .20 0 .55 P& |t | 0. 00 0 0. 03 6 0. 58 6 Nu mb er of ob s F( 2, 28 ) Pr ob & F R- sq uar ed Ad j R-s qu are d Ro ot MS E = = = = = = 31 56 0. 57 0. 00 00 0. 97 56 0. 97 39 38 5. 92St d. Er r. .0 753 07 6 .1 136 34 3 26 0.4 03 2[ 95% C onf . In ter va l] . 401 38 31 . 017 31 61 -3 90. 08 51 . 709 90 46 . 482 85 47 6 76. 73 83例 3.5.1(p85) . ( )g lnP1=ln(P1) g lnP0=ln(P0) g lnQ=ln(Q) g lnX=ln(X)So u r ce M o d el R e si d u al T o t al l nQ l nX l n P1 l n P0 _ c o ns SS .7 6 56 7 08 6 8 .0 1 77 4 81 8 3 .7 8 34 1 90 5 1 C o ef . . 5 39 9 16 7 -. 2 58 0 11 9 -. 2 88 5 60 9 5 .5 3 19 5 df 3 18 21 MS . 25 5 22 3 62 3 .0 0 09 8 60 1 . 03 7 30 5 66 9 t 1 4. 7 8 - 1. 4 5 - 1. 4 1 5 9. 4 1 P& | t| 0. 0 00 0. 1 65 0. 1 77 0. 0 00 N u mb e r o f o b s F( 3, 18) P r ob & F R - sq u a re d A d j R - sq u ar e d R o ot M SE = = = = = = 22 2 58 . 84 0 .0 0 00 0 .9 7 73 0 .9 7 36 .0 3 14S td . E r r. . 03 6 52 9 9 . 17 8 18 5 6 . 20 5 18 4 4 . 09 3 10 7 1[ 9 5 % C on f . I nt e rv a l] . 4 6 31 7 03 - . 6 32 3 66 -. 7 1 96 3 73 5 . 3 36 3 39 .6 1 66 6 31 .1 1 63 4 22 .1 4 25 1 55 5. 7 27 5 61drop lnX lnP1 lnP0 g lnXP0=ln(X/P0) g lnP1P0=ln(P1/P0) reg lnQ lnXP0 lnP1P0 So u r ce M o d el R e si d u al T o t al l nQ l n X P0 ln P 1 P0 _ c o nsSS . 76 5 6 32 3 3 1 .0 1 7 78 6 7 2 . 78 3 4 19 0 5 1 C oe f . .5 3 4 43 9 4 - .2 7 5 34 7 3 5. 5 2 45 6 9df 2 19 21MS . 3 82 8 1 61 6 5 . 0 00 9 3 61 4 3 . 0 37 3 0 56 6 9 t 23 . 0 4 -1 . 8 2 66 . 4 7 P& | t | 0. 0 0 0 0. 0 8 4 0. 0 0 0Nu m b er o f o b s F( 2, 19) Pr o b & F R- s q ua r e d Ad j R- s q ua r e d Ro o t M S E= = = = = =22 4 0 8. 9 3 0 . 00 0 0 0 . 97 7 3 0 . 97 4 9 . 03 0 6S td . E r r . . 02 3 19 8 4 . 15 1 14 3 2 . 08 3 10 7 7[ 95 % Co n f . I n te r va l ] . 48 5 8 84 6 - . 59 1 6 93 6 5 .3 5 0 62 2 . 58 2 99 4 2 .0 4 09 9 9 5 .6 9 85 1 5练习题 13(p105) ( )g lnY=ln(Y) g lnK=ln(K) g lnL=ln(L) reg lnY lnK lnLS o ur ce M od el R es i du al T ot al l nY l nK l nL _ co ns SS 21 . 60 4 92 6 6 5. 0 70 3 02 4 4 26 . 67 5 22 9 1 C o ef . . 6 09 2 35 6 . 3 60 7 96 5 1 . 15 3 99 4 df 2 28 30 MS 1 0 .8 0 24 6 33 . 18 1 08 2 23 . 8 89 1 74 3 03 t 3 .4 5 1 .7 9 1 .5 9 P& | t| 0. 0 02 0. 0 84 0. 1 24 N u mb er of ob s F ( 2, 28 ) P r ob & F R - sq ua r ed A d j R- s qu a re d R o ot M S E = = = = = = 31 5 9. 6 6 0 . 00 0 0 0 . 80 9 9 0 . 79 6 3 . 4 25 5 4St d . Er r . .1 7 63 77 9 .2 0 15 91 5 .7 2 76 11 4[ 95 % C o nf . I n te r va l ] . 24 7 94 1 9 -. 05 2 14 4 9 -. 3 36 4 5 . 97 0 52 9 3 . 77 3 73 7 8 2 .6 4 44 3 9第二问: 第二问: test b_[lnk]+b_[lnl]==1 第四章例 4.1.4 (P116) .(1)回归 ) g lnY=ln(Y) g lnX1=ln(X1) g lnX2=ln(X2) reg lnY lnX1 lnX2So ur ce M od el R e si du al T ot al l nY ln X1 ln X2 _ co ns SS 2 .9 60 99 2 3 . 8 35 74 41 2 3 3 . 79 67 36 4 2 Co ef . . 15 02 13 7 . 47 74 53 4 3 .2 66 06 8 df 2 28 30 MS 1 .4 80 49 6 15 . 02 98 48 0 04 . 12 65 57 8 81 t 1 .3 8 9 .2 5 3 .1 4 P &| t| 0 .1 77 0 .0 00 0 .0 04 N um b er o f o bs F ( 2, 2 8) P ro b & F R -s q ua re d A dj R- sq u ar ed R oo t M SE = = = = = = 31 49 . 60 0 .0 0 00 0 .7 7 99 0 .7 6 42 . 17 2 77S t d. E r r. . 1 08 53 7 9 . 0 51 59 5 1 1 . 04 15 9 1[ 95 % C on f. I n te rv a l] - .0 72 1 16 . 37 17 6 57 1 .1 32 4 65 . 37 25 4 35 . 58 31 4 12 5. 39 9 67于是得到方程: 于是得到方程: lnY=3.266+0.1502lnX1+0.4775lnX2(2)绘制参差图: )绘制参差图:predict e, resid g ei2=e^2scatter ei2 lnX2,title(&图 4.1.3 异方差性检验图 异方差性检验图&)xtick(6(0.4)9.2)ytick(0(0.04)0.24) 图predict 在 回 归结束后,需 要对拟合值以 及残差进行分 析,需要使用 此命令。 (3)G-Q 检验 )sort X2 drop in 13 /19 reg lnY lnX1 lnX2 in 1/12So ur ce M od el Re si du al T ot al l nY ln X1 ln X2 _ co ns SS . 19 94 72 28 .0 70 19 68 63 .2 69 66 91 42 Co ef . . 39 83 84 7 . 23 47 50 8 3 .1 41 20 9 df 2 9 11 MS . 09 97 36 14 .0 07 79 96 51 .0 24 51 53 77 t 5 .0 6 2 .1 4 2 .8 0 P& |t | 0. 00 1 0. 06 1 0. 02 1 N um be r of o bs F( 2, 9) P ro b & F R -s qu ar ed A dj R -s qu ar ed R oo t MS E = = = = = = 12 12 .7 9 0 .0 02 3 0 .7 39 7 0 .6 81 8 . 08 83 2St d. E rr . .0 78 79 08 .1 09 74 75 1. 12 23 58[9 5% C on f. In te rv al ] .2 20 14 75 - .0 13 51 53 .6 02 25 75 . 57 66 21 9 . 48 30 16 9 5. 68 01 6reg lnY lnX1 lnX2 in 13/24S ourc e Mode l Res idua l Tota l ln Y lnX 1 lnX 2 _con s SS 1.
Co ef. - .113 766 .
.993 643 df 2 9 11 MS .6
t -0.7 1 5.5 5 2.1 2 P&| t| 0.4 95 0.0 00 0.0 63 Num ber of o bs F( 2, 9) Pro b & F R-s quar ed Adj R-s quar ed Roo t MS E = = = = = = 12 32. 06 0 .00 01 0 .87 69 0 .84 96 . 145 75S td. Err . .
.884 053[95% Con f. Inte rva l] - .475 98 - .268
37 .87 274 72 8.2 556 68di F=0.2(可以用字母替代) (可以用字母替代) 2.2222(4)怀特检验(重新把原始数据出入) 怀特检验(重新把原始数据出入)reg lnY lnX1 lnX2 predict e ,resid g e2=e^2 g lnX12=(lnX1)^2 g lnX22=(lnX2)^2 g lnX1X2=lnX1*lnX2 reg e2 lnX1 lnX2 lnX12 lnX22 lnX1X2 Source Model Residual Total e2 lnX1 lnX2 lnX12 lnX22 lnX1X2 _consSS . . . Coef. -2.32907 -.97 ..24328df 5 25 30MS . . . t -2.09 -1.01 2.57 1.58 0.47 1.87 P&|t| 0.047 0.323 0.017 0.127 0.643 0.073Number of obs F( 5, 25) Prob & F R-squared Adj R-squared Root MSE= = = = = =31 9.83 0.9 0.Std. Err. 1.42 .522[95% Conf. Interval] -4..94404 -.0064095 -..031707 -.74 .27reg e2 lnX1 lnX2 lnX12 lnX22So urce M odel R esi dual T otal e2 lnX1 lnX2 l nX12 l nX22 _ cons SS .0
Co ef. -1 .851 123 -.
.763 275 df 4 26 30 MS .
t -4 .14 -1 .64 4 .10 1 .67 5 .64 P &|t | 0 .00 0 0 .11 2 0 .00 0 0 .10 7 0 .00 0 Numb er of obs F( 4, 26) Prob & F R-sq uar ed Adj R-s qua red Root MS E = = = = = = 31 12. 62 0.00 00 0.66 00 0.60 77 .026 39S td. Er r. . 446 727 3 . 157 159 8 . 030 766 8 . 010 310 9 1 .37 532 3[ 95% Co nf. Int erva l] -2 .76 938 4 -. 581 212 7 . 062 917 6 -. 003 980 2 4 .93 625 7 -.
.590 29g lne2= ln(e2) reg lne2 lnX2 lnX22S ourc e Mode l Res idua l Tota l lne 2 lnX 2 lnX2 2 _con s SS 29.2 . . 6322 48 Coef . -25. .7 . 1958 5 df 2 28 30 MS 14 .628 05 10 7492 t -2.6 3 2.6 5 2.4 7 P &|t| 0 .014 0 .013 0 .020 Nu mber of obs F( 2, 28) Pr ob & F R- squa red Ad j R- squa red Ro ot M SE = = = = = = 31 3.5 5 0 .042 3 0 .202 3 0 .145 3 2 .029 9Std. Err . 9.86 51 37.6 5529[95 % Co nf. Inte rval ] -46.
.329 2. predict m ,xb(和书上直接以差残作为权数是有区别的,理论上不能能以残差直接作为权 不能能以残差直接作为权 (和书上直接以差残作为权数是有区别的,理论上不能 数) . predictnl n=exp(xb()) . g wi=sqrt(n) . vwls lnX1 lnX2,sd(wi) Va ria nce -wei ght ed leas t-s quar es reg ress ion Go odn ess -of- fit ch i2(2 8) = 7 3.2 8 Pr ob & c hi2 = 0. 000 0 lnY lnX1 lnX2 _ cons Co ef. . 8 669 2 .338 164 S td. Er r. . 051 457 9 . 027 580 5 . 447 298 1 z 6 .17 15 .54 5 .23Nu mber of ob s Mo del chi 2(2 ) Pr ob & ch i2 P &|z | 0 .00 0 0 .00 0 0 .00 0= 31 = 263. 97 = 0.00 00[ 95% Co nf. Int erva l] . 216 876 5 . 374 612 2 1 .46 147 6 .4
. 2148 524.21(老师有标准答案) 例 4.21(老师有标准答案)reg Y XSo u rc e M o de l Re si d ua l T o ta l Y X _ c on s SS 2 . 48 19 e+ 09 3 0 25 90 23 .9 2 . 51 22 e+ 09 Co ef . . 43 75 26 8 2 09 1. 29 5 df 1 27 28 MS 2 . 48 19 e+ 09 1 1 20 70 4. 59 8 9 72 02 19 .8 t 47 .0 6 6 .2 4 P &| t| 0 .0 00 0 .0 00 N um be r o f ob s F( 1, 27 ) P ro b & F R -s qu ar e d A dj R -s q ua re d R oo t MS E = 29 = 2 21 4. 60 = 0. 00 00 = 0. 98 80 = 0. 98 75 = 10 58 .6S td . Er r . . 00 92 97 3 33 4. 98 7[9 5% Co nf . I nt er va l] .4 18 4 50 3 14 03 . 95 9 .4 56 60 33 27 78 .6 32predict e,resid tsset year time variable: year, 1978 to 2006 delta: 1 unit line e year,title(&残差相关图&)xtick(6)ytick(-00) scatter e e1,title(&残差相关图&)xtick(-00)ytick(-00)g T=_n g T2=T^2 reg Y X T2S ou r c e Mo d e l R e s id u a l To t a l Y X T2 _c o n s SS 2 .5 0 6 1 e +0 9 60 5 4 7 9 2. 7 2 .5 1 2 2 e +0 9 C o e f. .1 7 6 1 5 19 21 . 6 5 5 82 33 2 8 . 1 91 df 2 26 28 MS 1 . 2 5 31 e + 0 9 2 3 2 8 76 . 6 4 2 8 9 7 2 02 1 9 . 8 t 6.78 10.19 17.06 P &| t | 0 .0 0 0 0 .0 0 0 0 .0 0 0 N u m b e r o f ob s F( 2, 26 ) Prob & F R - s q u ar e d A d j R -s q u a re d R o o t MS E = 29 = 5 3 8 0 . 77 = 0 . 0 0 00 = 0 . 9 9 76 = 0 . 9 9 74 = 4 8 2 . 57St d . Er r . .0 2 5 9 85 8 2. 1 2 4 18 3 19 5 . 0 32 6[ 9 5% C o nf . I nt e r v a l] . 1 22 7 3 7 4 1 7. 2 8 9 5 2 9 27 . 2 9 6 .2 2 9 5 6 64 26 . 0 2 2 15 37 2 9 . 0 86reg e X T2 e1So urce M odel Resi dual T otal e X T2 e1 _ cons SS
C oef. -.143
82 910. 3409 df 3 24 27 MS
t -4.27 3.79 4.22 5.27 P&|t| 0.000 0.001 0.000 0.000 Number of obs F( 3, 24) Prob & F R-squa red Adj R- squared Root M SE = = = = = = 28 6 4.94 0. 03 0. .48Std. E rr. ..670 37 172.7 39[95 % Conf. Inter val] -.21
266 553 .8251 -.07
g e2=e[_n-1] reg e X T2 e1 e2Source Model Residual Total e X T2 e1 e2 _cons SS
Coef. -..83 4..1107 df 4 23 27 MS
t -3.80 2.72 4.13 0.09 2.76 P&|t| 0.001 0.012 0.000 0.929 0.011 Number of obs F( 4, 23) Prob & F R-squared Adj R-squared Root MSE = = = = = = 28 46.69 0.4 0.Std. Err. ..62 321.3096[95% Conf. Interval] -..58 -91.11 -..08 100.prais Y X T2,rhotype(orrc)Pr a i s- W i n st e n AR ( 1 ) r e g re s s io n - - i t er a t e d e s ti m a t es S o u rc e M o de l Re s i d ua l T o ta l Y X T2 _ c on s rh o SS 2 15 9 4 3 21 5 2 4 34 1 1 3 .9 3 2 18 3 7 7 32 9 C o e f. . 18 9 6 2 98 2 0. 7 9 5 27 3 11 8 . 1 69 .7 6 4 5 53 df 2 26 28 MS 1 07 9 7 1 60 7 9 3 61 9 . 7 66 4 7 7 99 1 9 0 .3 1 t 6. 4 7 7. 7 2 9. 4 7 P & |t | 0 . 00 0 0 . 00 0 0 . 00 0 Nu m b er o f o b s F( 2, 26) Pr o b & F R- s q ua r e d Ad j R- s q u ar e d Ro o t M S E = 29 = 1 1 53 . 3 0 = 0 .0 0 0 0 = 0 .9 8 8 9 = 0 .9 8 8 0 = 3 05 . 9 7Std. Err. . 0 2 9 29 7 9 2 . 6 9 31 6 2 3 2 9 . 43 2 4[ 95 % C on f . I n t e rv a l ] . 12 9 4 0 71 1 5. 2 5 9 39 2 44 1 . 0 11 . 2 4 98 5 2 4 2 6 . 33 1 1 4 3 7 9 5. 3 2 7Du r b in - W a ts o n st a t is t i c ( o r ig i n a l) 0 . 4 42 0 3 3 Du r b in - W a ts o n st a t is t i c ( t r an s f o rm e d ) 1 . 3 61 6 5 8newey lnY lnX, lag(2)4.3.1(P140) 例 4.3.1(P140)g lnX1=ln(X1) g lnX2=ln(X2) g lnX3=ln(X3) g lnX4=ln(X4) g lnX5=ln(X5) g lnY=ln(Y) reg lnY lnX1 lnX2 lnX3 lnX4 lnX5 S o ur c e M od e l R es i du a l T ot a l lnY ln X 1 ln X 2 ln X 3 ln X 4 ln X 5 _ co n sSS . 2 05 4 95 8 6 6 . 0 03 8 52 7 4 4 . 2 09 3 48 6 1 1 C oe f . . 38 1 14 4 6 1 .2 2 22 8 9 - . 08 1 10 9 9 - . 04 7 22 8 7 - . 10 1 17 3 7 - 4 .1 7 31 7 4df 5 19 24MS . 04 1 09 9 17 3 . 00 0 20 2 77 6 . 00 8 72 2 85 9 t 7. 5 9 9. 0 4 - 5. 3 0 - 1. 0 5 - 1. 7 5 - 2. 1 7 P& | t| 0. 0 00 0. 0 00 0. 0 00 0. 3 05 0. 0 96 0. 0 43N u m be r o f o b s F( 5, 19) Prob & F R - s qu a re d A d j R - sq u ar e d R o o t M SE= = = = = =25 2 0 2. 6 8 0 . 00 0 0 0 . 98 1 6 0 . 97 6 8 . 0 14 2 4St d . E r r. . 0 50 2 4 2 .1 3 51 7 8 6 .0 1 53 0 3 7 .0 4 47 6 7 4 .0 5 76 8 6 6 1. 9 23 6 2 4[9 5 % C on f . I n te r va l ] . 2 75 9 87 .9 3 93 5 66 - .1 1 31 4 09 - .1 4 09 2 79 - .2 2 19 1 31 - 8. 1 99 3 65 . 48 6 30 2 2 1 .5 0 52 2 1 - . 04 9 07 8 9 . 04 6 47 0 5 . 01 9 56 5 6 - . 14 6 98 3 8corr lnX1 lnX2 lnX3 lnX4 lnX5lnX 1 lnX 1 lnX 2 lnX 3 lnX 4 lnX 5 1. 000 0 - 0. 568 7 0. 451 7 0. 964 4 0. 440 2 ln X2 1. 00 00 - 0. 21 41 - 0. 69 76 - 0. 07 33 ln X3 ln X4 ln X51. 00 00 0. 39 88 0. 41 131. 00 00 0. 27 951. 00 00stepwise, pr(0.05) : reg Y X1 X2 X3 X4 X5 或者 stepwise, pe(0.05) : reg Y X1 X2 X3 X4 X5(逐步向前回归和逐步向后回归) reg lnY lnX1 lnX2 lnX3So urc e M ode l R esi dua l T ota l ln Y lnX 1 lnX 2 lnX 3 _ con s SS . 204 871 849 . 004 476 761 . 209 348 611 Coe f. .32 338 49 1.2 907 29 - .08 675 39 - 5.9 996 38 df MS Nu mbe r o f o bs F( 3 , 2 1) Pr ob & F R- squ are d Ad j R -sq uar ed Ro ot MSE P&| t| 0.0 00 0.0 00 0.0 00 0.0 00 = = = = = = 25 320 .34 0.0 000 0.9 786 0.9 756 .0 1463 . 068
. 008 7228 59 S td. Er r. . 010 860 8 . 096 153 4 . 015 154 9 1 .16 207 8 t 29 .78 13 .42 -5 .72 -5 .16[9 5% Con f. Int erv al] .3 007 987 1. 090 767 -.1 182 702 -8. 416 312 .3 459 711 1. 490 691 -.0 552 376 -3. 582 964 4.4. P151) 例 4.4.1(P151)reg X1 X2 ZSo ur ce M od el Re si du al T ot al X1 X2 Z _ co ns SS 32 32 80 64 9 2 32 39 12 .1 2 32 56 04 56 1 C oe f. -. 47 09 04 1. 46 05 39 13 2. 74 16 df 2 28 30 MS 16 16 40 32 4 8 29 96 .8 61 6 1 08 53 48 5. 4 t - 4. 08 1 6. 98 0. 68 P & |t | 0 . 00 0 0 . 00 0 0 . 50 0 N um be r of o bs F( 2, 2 8) P ro b & F R -s qu ar ed A dj R -s qu ar ed R oo t MS E = 31 = 1 94 7. 55 = 0. 00 00 = 0. 99 29 = 0. 99 24 = 28 8. 09S td . Er r. . 11 54 63 3 . 08 60 02 2 1 94 .2 84 3[9 5% C on f. I nt er va l] - .7 07 41 99 1. 28 43 72 - 26 5. 23 17 - .2 34 38 81 1. 63 67 07 53 0. 71 49predict v,resid reg Y X1 X2 vS ou r c e Mo d e l R e s id u a l To t a l Y X1 X2 v _c o n s SS 16 9 9 7 73 9 2 1 16 4 6 8 8. 9 9 17 1 1 4 20 8 1 C o ef . .4 5 0 2 36 3 .4 0 2 5 89 7 1. 1 9 1 13 7 15 5 . 6 97 5 df 3 27 30 MS 5 6 65 9 1 30 . 6 4 3 13 6 . 62 9 2 5 7 04 7 3 6. 0 2 t 10 . 6 1 6.31 8.35 1.11 P & |t | 0 . 00 0 0 . 00 0 0 . 00 0 0 . 27 6 N u m b er o f o b s F ( 3, 27) Prob & F R - s q ua r e d A d j R- s q u ar e d Root MSE = 31 = 1 3 13 . 4 8 = 0 .0 0 0 0 = 0 .9 9 3 2 = 0 .9 9 2 4 = 2 07 . 6 9Std. Err. . 0 42 4 5 1 . 0 6 38 2 6 8 . 1 4 27 0 3 1 1 4 0 .1 5 2 2[ 95 % C on f . I n t e rv a l ] . 36 3 1 3 39 . 27 1 6 2 78 . 89 8 3 3 41 - 13 1 . 8 71 . 5 3 73 3 8 6 . 5 3 35 5 1 5 1 . 4 83 9 3 9 4 4 3. 2 6 6ivreg Y X2 (X1=Z)Ins trum ental var iabl es (2 SLS) reg ress ion S ource Model Res idual Total Y X1 X2 _cons SS 166 1 870.6 6 171 14208 1 Coef. .45 097 155 .6975 df MS Numb er o f ob s F( 2, 28 ) Prob & F R-sq uare d Adj R-sq uare d Root MSE P& |t| 0. 000 0. 003 0. 568 = = = = = = 31 513. 69 0.00 00 0.97 39 0.97 21 399. 192 8
159 352.5 24 30 570 4736. 02 S td. Err. . 2 676 2 69.3 743 t 5 .52 3 .28 0 .58[ 95% Conf . Int erva l] .
96.0 907 .6
7.48 58reg Y X1 X2 Sourc e Mode l Residua l Tota l Y X1 X2 _con sSS 16
1142081 Coef. .5
3.3266df 2 28 30MS .2 7
t 7.38 2.20 0.55 P &|t| 0 .000 0 .036 0 .586N umber of obs F ( 2, 28) P rob & F R -squared A dj R-squ ared R oot MSE= = = = = =31 560.57 0.6 0.Std. E rr. .363 43 260.40 32[95% C onf. In terval] .731 61 -390.08 51 . 7099046 .
76.7383第 4 章练习 8(P154) ( )(1)回归 回归 rename var1 X rename var2 Y reg Y XS ou r c e Mo d e l R e s id u a l To t a l Y X _c o n s SS 49 3 4 2 1 44 8 4 67 4 2 . 3 52 5 0 18 8 8 8 6 .4 Coef. .7 5 5 1 2 5 2 72 . 3 6 3 5 df 1 18 19 MS 4 9 3 4 2 14 4 4 70 4 1 . 2 41 8 2 64 1 5 2 0 .3 4 t 3 2. 3 9 1. 7 1 P&|t| 0.000 0.105 N u m be r o f o b s F( 1, 18) Prob & F R - s qu a r e d A d j R - s q u ar e d Root MSE = 20 = 1 0 4 8 . 91 = 0 . 0 0 00 = 0 . 9 8 31 = 0 . 9 8 22 = 2 1 6 . 89S t d. E r r. . 0 23 3 1 5 7 1 5 9. 6 7 7 2[9 5 % C on f . I nt e r v a l] .7 0 6 1 4 04 -6 3 . 1 0 59 .8 0 4 1 0 95 60 7 . 8 3 29(2)异方差判断(4 种方法) 异方差判断( 种方法) predict e,resid g e2=e^2 scat scatter e2 Xi 通过观测散点图可知残差有明显 的扩大趋势 ii 通过怀特检验, 原假设为同方差, p 值&0.05,拒绝原假设。 上述两种方法证明存在异方差 imtest,whiteW hi t e' s t e st fo r H o: ho m os k ed a st i ci t y a ga i ns t H a: un r es t ri c te d h e te ro s ke d as t ic i ty c hi 2 (2 ) P ro b & c h i2 = = 1 2 .6 5 0. 0 01 8C am e ro n & Tr i ve di ' s d ec o mp o si t io n o f I M- t es t S ou r ce H e te r os k ed a st ic i ty S ke wn e ss K ur to s is To t al c hi 2 1 2 .6 5 5 .1 6 1 .8 5 1 9 .6 6 df 2 1 1 4 p 0. 0 01 8 0. 0 23 2 0. 1 73 3 0. 0 00 6(3)解决异方差 predict e,residuals g e2=e^2 reg le2 XSo u rc e M o de l R e si d ua l T o ta l le 2 X _ c on s SS 1 8 .3 1 7 43 0 2 4 2 .2 8 8 96 8 9 6 0 .6 0 6 39 9 1 C o ef . . 00 0 4 60 1 6 .8 2 5 13 2 df 1 18 19 MS 18 . 3 17 4 30 2 2. 3 4 93 8 71 6 3. 1 8 98 1 04 8 t 2. 7 9 6. 0 5 P & | t| 0 . 0 12 0 . 0 00 N u mb e r o f o b s F( 1, 18) P r ob & F R - sq u ar e d A d j R -s q ua r e d R o ot MS E = = = = = = 20 7 . 80 0 .0 1 20 0 .3 0 22 0 .2 6 35 1 .5 3 28St d . E rr . .0 0 01 6 48 1. 1 28 4 46[ 9 5% Co n f . I nt e rv a l] . 0 00 1 13 9 4 . 45 4 35 5 .0 0 08 0 63 9 . 19 5 91predict m,xb predictnl h=exp(xb()) reg Y X [w=1/h]S our ce Mod el Res idu al Tot al Y X _co ns SS 1 125 446 1.3 4 724 02. 755 1 172 686 4.1 Coe f. .73 995 51 359 .38 44 df 1 18 19 MS 112 544 61. 3 262 44. 597 5 617 203 .37 2 t 20. 71 1. 82 P& |t| 0. 000 0. 086 Nu mbe r o f ob s F( 1 , 18 ) Pr ob & F R- squ are d Ad j R -sq uare d Ro ot MSE = = = = = = 20 42 8.8 3 0. 000 0 0. 959 7 0. 957 5 16 2St d. Err. .0 357 325 1 97. 876[9 5% Conf . I nter val ] . 664 884 -56 .33 756 .815 026 3 775. 106 4 p155) 练习题 9(p155)g lnX=ln(X) lnY=ln(Y g lnY=ln(Y) reg lnY lnXS o u r ce M o d el R e s i d u al T o t al l nY l nX _ c o ns SS 45 . 5 7 9 34 7 7 .3 2 8 1 9 24 7 1 45 . 9 0 7 54 0 1 C o ef . . 8 5 4 4 15 4 1 . 5 8 8 47 8 df 1 26 27 MS 4 5. 5 7 9 3 47 7 . 01 2 6 2 2 78 7 1 .7 0 0 2 7 92 6 t 6 0. 0 9 1 1. 8 3 P& | t | 0. 0 0 0 0. 0 0 0 Number of obs F( 1, 26) Prob & F R - s q u ar e d A d j R -s q u a r e d R o o t MS E = 28 = 3 6 10 . 8 8 = 0 .0 0 0 0 = 0 .9 9 2 9 = 0 .9 9 2 6 = . 11 2 3 5S td . E r r. . 01 4 2 1 8 8 . 13 4 2 1 9 6[ 9 5% C o n f . I n t e rv a l ] . 8 25 1 8 8 3 1 . 31 2 5 8 6 . 8 8 36 4 2 6 1 . 86 4 3 7判断相关性: ( 判断相关性: 通过 e-t 或者 DW 值) predict e ,resid line e year scatter e l.etsset year time variable: year, 1980 to 2007 delta: 1 unit estat dwatson DurbinDurbin-Watson d-statistic( 2, 28) = .3793231 表明有正自相关性 自相关性。 表明有正自相关性。 ,corc prais lnY lnX ,corcC ochr ane- Orcu tt AR (1) regr essi on -- ite rate d es timat es Sou rce Mo del R esid ual To tal lnY lnX _c ons rho SS .0
Co ef. .504 519 1 1.95 764 .
df 1 25 26 MS .
t 5. 12 3. 29 P&|t | 0.00 0 0.00 3 N umbe r of obs F( 1, 25) P rob & F R -squ ared A dj R -squa red R oot MSE = = = = = = 27 26.2 3 0 .000 0 0 .512 0 0 .492 5 .056 5St d. Er r. .0 . 63146 6[9 5% Co nf. Inte rval ] .3 .
. 4367 9D urbi n-Wa tson stat isti c (o rigi nal) 0 .379 323 D urbi n-Wa tson stat isti c (t rans forme d) 0 .832 823 reg e lnX L.eS ou rce Mo del Res id ual To tal e lnX e L1. _c ons SS . 18 875 65 53 . 10 265 95 88 . 29 141 61 41 Co ef . .0 057 43 9 .7 661 69 4 - .0 642 31 3 df 2 24 26 MS .09 437 82 77 .00 427 74 83 .01 120 83 13 t 0 .66 6 .57 -0 .77 P& |t | 0. 51 8 0. 00 0 0. 44 9 Nu mbe r of ob s F( 2 , 24 ) Pr ob & F R- squ ar ed Ad j R -s qua re d Ro ot MS E = = = = = = 27 22 .0 6 0.0 00 0 0.6 47 7 0.6 18 4 .0 65 4S td. E rr. . 008 75 79 . 116 66 84 . 083 37 49[9 5% Co nf . I nt erv al ] -.0 12 331 6 .5 25 377 7 -.2 36 308 6 .0 238 19 4 1. 006 96 1 . 107 84 6reg e lnX L.e l2.eSo u r ce M o d el R e si d u al T o t al e l nX e L 1. L 2. _ c o ns SS .1 8 9 49 0 7 9 . 07 0 0 47 0 3 3 . 25 9 5 37 8 2 3 C oe f . .0 0 7 86 8 5 1. 1 5 21 0 2 - .5 1 0 10 4 5 - .0 8 1 32 0 9 df 3 22 25 MS . 0 6 31 6 3 59 7 . 0 0 31 8 3 95 6 . 0 1 03 8 1 51 3 t 0. 9 6 6. 4 8 - 3. 0 4 - 1. 0 3 P& | t | 0. 3 4 8 0. 0 0 0 0. 0 0 6 0. 3 1 4 N um b e r o f o b s F( 3, 22) P ro b & F R -s q u ar e d A dj R -s q u ar e d R oo t MS E = = = = = = 26 1 9 .8 4 0 . 0 00 0 0 . 7 30 1 0 . 6 93 3 . 0 5 64 3S td . Er r . . 00 8 2 02 9 . 17 7 8 10 5 . 16 8 0 21 7 .0 7 8 95 4[ 9 5% C on f . I n te r v al ] - . 0 09 1 4 33 . 7 83 3 4 56 - . 8 58 5 6 01 - . 2 45 0 6 15 . 02 4 8 80 3 1 .5 2 0 85 8 - . 16 1 6 48 8 . 08 2 4 19 6reg e lnX L.e l2.e l3.eS o u rc e M o de l R es i d ua l T o ta l e ln X e L1 . L2 . L3 . _ c on s SS . 1 9 43 6 8 26 8 . 0 6 45 2 3 89 6 . 2 5 88 9 2 16 3 C o e f. . 0 02 5 1 04 1 . 20 2 6 47 - . 4 91 4 3 12 . 00 5 6 66 - . 0 26 9 6 81 df 4 20 24 MS . 0 4 85 9 2 06 7 . 0 0 32 2 6 19 5 . 0 1 07 8 7 17 3 t 0. 2 7 5. 4 6 - 1. 6 0 0. 0 3 - 0. 3 0 P & |t | 0 . 79 0 0 . 00 0 0 . 12 5 0 . 97 8 0 . 76 8 Nu m b er o f o b s F( 4, 20) Pr o b & F R- s q ua r e d Ad j R- s q u ar e d Ro o t M S E = = = = = = 25 15 . 0 6 0 .0 0 0 0 0 .7 5 0 8 0 .7 0 0 9 .0 5 6 8St d . E r r . .0 0 9 28 4 2 .2 2 0 18 0 7 .3 0 7 09 0 8 .2 0 3 86 6 3 .0 9 0 21 1 4[ 95 % C on f . I n t e rv a l ] - . 01 6 8 5 61 . 74 3 3 5 83 - 1 .1 3 2 0 11 - . 41 9 5 9 16 - . 21 5 1 4 59 . 0 21 8 7 7 1 . 6 61 9 3 6 . 1 4 91 4 8 9 . 4 3 09 2 3 5 . 1 6 12 0 9 6newey lnY lnX, lag(2)R eg re ss io n wi th N ew ey -W es t st an da rd e rr or s m ax im um l ag : 2 N um be r of ob s F( 1, 26 ) P ro b & F = = = 28 1 61 5. 20 0. 00 00ln Y ln X _c on sC oe f. .8 54 41 54 1. 58 84 78Ne we y- We st S td . Er r. . 02 12 59 6 . 20 87 09 1t 4 0. 19 7. 61P &| t| 0 .0 00 0 .0 00[ 95 % C on f. I nt er va l] . 81 0 71 57 1. 1 59 47 .8 98 11 52 2. 01 74 86 X1=Xg X1=X-L.X Y1=Yg Y1=Y-L.Y X1 reg Y1 X1Sou rc e Mo de l Re sid ua l To ta l Y1 X1 _c on s SS 48 52 27 703 305 20 49 3.1 51 57 48 196 C oe f. .5 96 41 35 88 9. 33 87 df 1 25 26 MS 4 85 227 70 3 12 20 819 .7 3 19 83 646 9. 1 t 1 9. 94 3. 41 P&| t| 0.0 00 0.0 02 N um be r o f obs F( 1, 25) P ro b & F R -s qu are d A dj R -sq ua red R oo t MSE = = = = = = 27 3 97 .46 0 .0 000 0 .9 408 0 .9 385 1 10 4.9Std . Err . .02 99 158 260 .8 835[9 5% Co nf. I nte rv al] .5 348 00 8 35 2.0 39 1 .65 80 262 142 6. 638estat dwatson DurbindDurbin-Watson d-statistic( 2,27) = .960842810(P155) 4-练习题 10(P155)reg Y X1 X2Source Model R es i d u a l Total Y X1 X2 _cons SS 8 5 5 3 0 5 .8 6 7 3 3 6 9 4 . 13 2 9 8 8 90 0 0 C o ef . . 5 6 8 4 24 5 - . 0 0 5 8 32 6 2 4 5 . 5 15 8 df 2 7 9 MS 4 2 7 6 5 2. 9 3 4 4 8 1 3 . 44 7 5 5 9 8 7 7 7 .7 7 7 8 t 0.79 -0.08 3.53 P& | t | 0. 4 5 3 0. 9 3 6 0. 0 1 0 N um b e r o f ob s F( 2, 7) P ro b & F R -s q u a r e d A dj R - s q u a re d R oo t M S E = = = = = = 10 8 8. 8 5 0 . 00 0 0 0 . 96 2 1 0 . 95 1 3 6 9 .3 7 9Std. Err. . 7 1 60 9 7 5 . 0 7 02 9 3 7 6 9 . 52 3 4 8[ 9 5 % C o nf . I n t e r va l ] -1.124877 -..11887 2 . 2 6 17 2 6 . 1 6 0 38 5 5 4 0 9 . 91 2 7第五章5.1.1(P160) 例 5.1.1(P160)reg Y1 X1 S o u rc e M o de l R e s i d ua l T o ta l Y1 X1 _ c on sSS 1 8 2 4 36 6 3 9 9 0 7 2 8 20 . 6 3 1 9 1 5 09 4 6 0 C oe f . . 6 9 1 97 1 4 4 5 0 . 34 1 3df 1 29 30MS 1 8 2 4 36 6 3 9 3 1 2 8 5 5. 8 8 4 6 3 8 3 6 48 . 6 6 t 24.15 1.16 P & | t| 0 . 0 00 0 . 2 56N u mb e r o f o b s F( 1, 29) P r ob & F R - sq u a r e d A d j R - s q ua r e d R o ot M S E= = = = = =31 5 8 3 . 13 0 . 0 0 00 0 . 9 5 26 0 . 9 5 10 5 5 9 . 34S t d . Er r . . 0 2 8 6 55 3 3 8 8 . 9 09 1[ 9 5 % Co n f . In t e r v a l] . 6 3 3 3 64 8 -3 4 5 . 0 67 2 . 7 5 0 5 78 1 2 4 5 . 75reg Y2 X2So ur ce M od el Re si du al T ot al Y2 X2 _ co ns SS 603 99 15 3. 9 70 66 32 8. 2 674 65 48 2. 1 C oe f. .7 19 50 35 17 9. 18 48 df 1 29 30 MS 6 03 99 15 3.9 24 36 66 .49 22 48 84 9.4 t 1 5.7 4 0.8 1 P& |t | 0. 00 0 0. 42 5 N um be r of o bs F( 1, 2 9) P ro b & F R -s qu ar ed A dj R -s qu ar ed R oo t MS E = = = = = = 31 2 47 .8 8 0 .0 00 0 0 .8 95 3 0 .8 91 6 4 93 .6 3S td . Er r. . 04 56 99 9 2 21 .5 78 8[9 5% C on f. In te rv al ] .6 26 03 67 - 27 3. 99 48 . 81 29 70 3 6 32 .3 64 4tab(region),g(D)r e g i on ? ? ?ò ? ? ?? T o t aldrop D1 g DX=D2*X reg Y X D2 DXF r eq . 31 31 62P e r ce n t 5 0. 0 0 5 0. 0 0 1 0 0. 0 0Cu m . 5 0. 0 0 1 0 0. 0 0 S our ce Mod el R es idu al Tot al Y X D2 DX _co nsSS 82 84 61 102 1 61 39 14 8.8 84 46 00 251 C oe f. .6 91 97 14 - 27 1. 15 65 .0 27 53 21 45 0. 34 13dfMS3 27 615 37 01 58 2 78 261 .1 87 61 1 38 459 05 .8 St d. Er r. .0 270 24 5 43 6.5 69 9 .0 558 15 1 36 6.7 77 2 t 25 .6 1 -0 .6 2 0 .4 9 1 .2 3 P &| t| 0 .0 00 0 .5 37 0 .6 24 0 .2 24N um be r o f ob s F( 3, 58 ) P ro b & F R -s qu are d A dj R -sq ua re d R oo t MSE= = = = = =62 99 2.4 3 0. 000 0 0. 980 9 0. 979 9 5 27. 5[9 5% Co nf . I nt er val ] .6 378 75 9 - 11 45. 04 6 - .0 841 93 9 -2 83. 84 3 .7 46 066 9 60 2. 733 1 .1 39 258 1 11 84 .52 6例 5.2.2(P168) 和书上的答案略有不同) 5.2.2(P168) 和书上的答案略有不同) (X1=X[_ng X1=X[_n-1] X2=X[_ng X2=X[_n-2] X3=X[_ng X3=X[_n-3] X4=X[_ng X4=X[_n-4] X5=X[_ng X5=X[_n-5] X6=X[_ng X6=X[_n-6] X7=X[_ng X7=X[_n-7] g lnX=ln(X) g lnX1=ln(X1) g lnX2=ln(X2) g lnX3=ln(X3) g lnX4=ln(X4) g lnX5=ln(X5) g lnX6=ln(X6) g lnX7=ln(X7) g lnY=ln(Y) g W0=lnX+lnX1+lnX2+lnX3+lnX4+lnX5+lnX6+lnX7 W1=lnX1+2*lnX2+3*lnX3+lnX*4+lnX5*5+lnX6 g W1=lnX1+2*lnX2+3*lnX3+lnX*4+lnX5*5+lnX6*6+lnX7*7 W2=4*lnX2+9*lnX3+lnX *16+lnX5*25+lnX6 4*lnX2+9*lnX3+lnX4 g W2=4*lnX2+9*lnX3+lnX4*16+lnX5*25+lnX6*36+lnX7*49 reg lnY W0 W1 W2S ou rc e Mo de l R es id ua l To ta l ln Y W0 W1 W2 _c on s SS 5 .0 19 940 38 . 02 39 448 95 5 .0 43 885 27 C oef . . 14 253 7 - .0 58 047 7 .0 06 267 6 6. 70 836 6 df 3 17 20 MS 1. 67 33 134 6 .0 01 40 852 3 .2 52 19 426 4 t 6. 11 -2. 82 2. 14 1 57. 31 P &| t| 0 .0 00 0 .0 12 0 .0 47 0 .0 00 Nu mb er of o bs F( 3, 1 7) Pr ob & F R- sq uar ed Ad j R-s qu ar ed Ro ot MS E = 21 = 1 18 7. 99 = 0. 00 00 = 0. 99 53 = 0. 99 44 = .0 37 53St d. E rr . . 02 33 24 .0 20 62 04 . 00 29 26 .0 42 64 49[ 95% C on f. I nt er va l] . 093 32 77 - .10 15 53 . 000 09 42 6 .61 83 93 .1 91 74 64 - .0 14 54 24 . 01 24 41 6. 79 83 39 5.2.2(P173) 例 5.2.2(P173)tsset yeartime variable: year, 1978 to 2007 delta: 1 unitYt1=Y[_ng Yt1=Y[_n-1] reg Y X P Yt1S o ur ce M od el R es i du al T ot al Y X P Y t1 _ co ns SS 2. 26 8 4e +0 9 32 20 9 32 .7 9 2. 27 1 7e +0 9 C oe f. . 03 5 70 98 7 .4 5 57 27 . 72 3 63 37 -2 02 . 52 74 df MS Nu m be r of o bs F( 3 , 2 5) Pr o b & F R- s qu ar ed Ad j R -s qu ar ed Ro o t MS E P &| t| 0 .0 09 0 .0 23 0 .0 00 0 .3 70 = = = = = = 29 58 69 .0 0 0 .0 00 0 0 .9 98 6 0 .9 98 4 3 58 .9 43 7 56 14 60 42 2 5 12 88 37 .3 12 2 8 81 13 06 80 .7 S td . E rr . .0 1 25 65 3 .0 6 57 32 . 13 2 79 63 2 21 . 96 48 t 2 .8 4 2 .4 3 5 .4 5 -0 .9 1[9 5% C on f. In te rv al ] .0 09 83 17 1. 14 17 33 .4 50 13 46 - 65 9. 67 24 .0 61 58 8 1 3. 76 97 2 . 99 71 32 8 2 54 .6 17 6P186) 练习题 5(P186)相似,具体步骤略) (和例 5.2.3 相似,具体步骤略) * (1)估计 Ytsset yeartime variable: year, 1970 to 1991 delta: 1 unit Yt1=Y[_ng Yt1=Y[_n-1] reg Y X Yt1So urc e M ode l Re si dua l T ota l Y X Yt 1 _ con s SS 5 196 3. 617 7 7 52. 64 086 1 5 271 6. 258 6 Co ef. .64 80 192 .24 15 177 -14 .5 344 df 2 18 20 MS 25 981 .80 89 41 .81 338 12 26 35. 812 93 t 6 .26 1 .97 -2 .98 P& |t| 0. 000 0. 064 0. 008 N umb er of ob s F ( 2, 18 ) P rob & F R -sq uar ed A dj R-s qu are d R oot MS E = = = = = = 21 6 21. 38 0 .00 00 0 .98 57 0 .98 41 6 .46 63Std . E rr . .10 344 73 .12 238 11 4. 877 17[ 95% C onf . I nte rva l] . 430 68 44 -. 015 59 54 -2 4.7 80 95 .8 653 54 .49 863 08 - 4.2 878 46通过自回归模型的参数估计, 可以得到 Y*即理想的或长期的新建厂房企业开支。 即理想的或长期的新建厂房企业开支。 通过自回归模型的参数估计, (2)存量调整模型 对数转换) 存量调整模型( (2)存量调整模型(对数转换) : g lnY=ln(Y) g lnYt1=ln(Yt1) g lnX=ln(X) reg lnY lnX lnYt1Source Model Residual Total lnY lnX lnYt1 _cons SS 6.. Coef. .6494 df 2 18 20 MS 3.0367359 t 7.33 1.75 -5.24 P&|t| 0.000 0.098 0.000 Number of obs F( 2, 18) Prob & F R-squared Adj R-squared Root MSE = 21 = 1023.79 = 0.0000 = 0.9913 = 0.9903 = .05482Std. Err. .61[95% Conf. Interval] .7016728 -...10668 -.6797361代表理想的销售量, 表示, 方程中, (3)以 X*代表理想的销售量,用 X 和 Xt-1 表示,带入 Y 方程中,重 (结果略) (结果略 新估计模型 Y。通过整理得到β0,β1。 结果略) 通过整理得到βXt1=X[_ng Xt1=X[_n-1] reg Y X Xt1S ou rc e Mo de l R es id ua l To ta l Y X Xt 1 _c on s SS 51 95 5. 83 36 76 0. 42 50 36 52 71 6. 25 86 Co ef . . 42 40 54 2 . 41 96 94 9 - 16 .1 01 2 df 2 18 20 MS 25 97 7. 91 68 42 .2 45 83 53 26 35 .8 12 93 t 1 .9 1 1 .9 2 -3 .5 7 P& |t | 0. 07 2 0. 07 1 0. 00 2 N u mb er o f ob s F ( 2, 18 ) P r ob & F R - sq ua re d A d j R- sq ua re d R o ot M SE = = = = = = 21 6 14 .9 2 0 .0 00 0 0 .9 85 6 0 .9 84 0 6 .4 99 7St d. E rr . .2 21 86 .2 19 06 31 4. 50 52 87[ 95 % Co nf . In te rv al ] -. 04 20 56 4 -. 04 05 39 5 -2 5. 56 64 5 . 89 01 64 9 . 87 99 29 3 -6 .6 35 94 2 第六章 6.4.1(P215) 估计,其他方法略) 例 6.4.1(P215)(通过 2SLS 估计,其他方法略) ;tsset year Ct=C[_ng Ct=C[_n-1] reg Y Ct GS ou r c e Mo d e l R e s id u a l To t a l Y Ct G _c o n s SS 1 . 4 1 4 8 e +1 1 5 0 6 7 0 4 73 3 1 . 4 1 9 9 e +1 1 C o e f. 1 . 2 5 8 6 35 2 . 7 9 4 4 37 1 2 9 1 . 1 53 df 2 26 28 MS 7 . 0 7 41 e + 1 0 1 9 4 8 86 4 3 . 6 5 . 0 7 10 e + 0 9 t 9.29 12.76 0.98 P&|t| 0.000 0.000 0.336 Number of obs F( 2, 26) Prob & F R-squared Adj R-squared Root MSE = 29 = 3629.86 = 0.0000 = 0.9964 = 0.9962 = 4414.6Std. Err. ..612[95% Conf. Interval] ..17.237 1..9.543predict m,xb. r eg C m C t S o ur c e M od e l R es i du a l T ot a l C m Ct _ co n s SS 1 .9 92 1 e+ 1 0 4 98 57 0 78 . 8 1 .9 97 1 e+ 1 0 C o ef . .0 85 1 00 9 .8 61 7 01 1 88 6. 5 72 5 df 2 26 28 MS 9 . 96 0 4e +0 9 1 9 17 5 79 .9 5 7 13 2 36 66 6 t 3. 4 6 1 1. 8 3 2. 2 1 P & |t | 0 . 00 2 0 . 00 0 0 . 03 6 Nu m be r o f o bs F( 2 , 2 6) Pr o b & F R- s qu a re d Ad j R - sq u ar ed Ro o t M SE = 29 = 5 19 4 .2 5 = 0. 0 00 0 = 0. 9 97 5 = 0. 9 97 3 = 13 8 4. 8St d. Er r . .0 24 5 86 9 .0 72 8 37 1 40 0. 8 77 7[9 5 % C on f. In t er v al ] .0 3 45 6 18 .7 1 19 8 23 62 . 55 6 66 . 1 35 6 40 1 1 .0 1 14 2 1 7 10 . 58 8P228) 2SLS) 练习题 8(P228) 2SLS) (reg M Y PS o ur ce M od el R es i du al T ot al M Y P _ co ns SS 2 .3 4 13 e+ 1 1 1 .8 2 29 e+ 0 9 2 .3 5 96 e+ 1 1 Co ef . 1. 8 10 21 9 - 14 7 .4 10 8 2 0 67 .0 1 df 2 15 17 MS 1 .1 70 7 e+ 11 12 15 2 55 09 1 .3 88 0 e+ 10 t 28 .6 8 -2 .3 5 0 .1 4 P & |t | 0 . 00 0 0 . 03 3 0 . 88 8 Nu mb e r of ob s F( 2 , 15 ) Pr ob & F R- sq u ar ed Ad j R -s qu a re d Ro ot MS E = = = = = = 18 96 3 .3 1 0. 0 00 0 0. 9 92 3 0. 9 91 2 1 1 02 4S t d. E r r. . 0 63 11 2 5 6 2 .8 48 5 5 1 4 47 3. 7 7[ 9 5% C o nf . I nt er v al ] 1 . 67 56 9 8 -2 8 1. 36 9 3 - 2 87 83 . 1 1 .9 4 47 4 - 13 .4 5 22 5 32 91 7 .1 2predict m,xb reg Y M C I S ou r ce Mo d el Re s id u al To t al Y M C I _c o nsSS 8. 1 42 6 e+ 1 0 12 0 79 8 46 . 3 8. 1 43 8 e+ 1 0 C o ef . -. 0 21 7 16 6 1 . 60 1 02 2 . 8 97 4 17 8 5 4 1. 9 41 7df 3 14 17MS 2. 7 14 2 e+ 1 0 86 2 84 6 .1 6 6 4. 7 90 5 e+ 0 9 t -1 . 11 27 . 73 24 . 33 0 . 67 P &| t | 0 .2 8 4 0 .0 0 0 0 .0 0 0 0 .5 1 1Nu m be r o f o bs F( 3 , 1 4) Pr o b & F R- s qu a re d Ad j R - sq ua r ed Ro o t M SE= 18 =3 1 45 6 .3 0 = 0. 0 00 0 = 0. 9 99 9 = 0. 9 99 8 = 9 2 8. 9St d . E rr . .0 1 95 1 31 .0 5 77 3 08 .0 3 68 8 83 80 3 .0 2 33[9 5 % Co n f. In t er v al ] -. 0 63 56 8 1. 4 77 20 2 .8 1 83 00 3 - 11 8 0. 37 2 . 0 20 1 34 8 1 . 72 4 84 3 . 9 76 5 35 2 2 2 64 . 25 5 1. 安装 estout。最简单的方式是在 stata 的指令输入: ssc install estout, replace EST 安装的指导网址是:http://repec.org/bocode/e/estout/installation.html 2.跑你的 regression 3.写下这行指令 esttab using test.rtf,然后就会出现个漂亮的表格给你(WORD 文档)。只要 再小幅修改,就可以直接用了。这个档案会存在 my documentstata 下。如果你用打开的是一 个 stata do file, 结果会保存到 do 文件所在文件夹中。 如果要得到 excel 文件, 就把后缀改为.xls 或者.csv 就可以了 4.跑多个其实也不难,只要每跑完一个 regression,你把它取个名字存起来:est store m1。 m1 是你要改的,第一个 model 所以我叫 m1,第二个的话指令就变成 est store m2,依次类 推。 5.运行指令:esttab m1 m2 ... using test.rtf 就行了。异方差的检验:Breusch-Pagan test in STATA: 其基本命令是:estat hettest var1 var2 var3 其中,var1 var2 var3 分别为你认为导致异方差性的几个自变量。是你自己设定的一个 滞后项数量。 同样,如果输出的 P-Value 显著小于 0.05,则拒绝原假设,即不存在异方差性。 White 检验: 其基本命令是在完成基本的 OLS 回归之后,输入 imtest, white 如果输出的 P-Value 显著小于 0.05,则拒绝原假设,即不存在异方差性处理异方差性问题的方法: 方法一:WLS WLS 是 GLS(一般最小二乘法)的一种,也可以说在异方差情形下的 GLS 就是 WLS。在 WLS 下,我们设定扰动项的条件方差是某个解释变量子集的函数。之所以被称为加权最小 二乘法,是因为这个估计最小化的是残差的加权平方和,而上述函数的倒数恰为其权重。 在 stata 中实现 WLS 的方法如下: reg (被解释变量) (解释变量 1) (解释变量 2)…… [aweight=变量名] 其中,aweight 后面的变量就是权重,是我们设定的函数。 一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指数函数。在 stata 中也可以方便地实现: 首先做标准的 OLS 回归,并得到残差项; reg (被解释变量) (解释变量 1) (解释变量 2)…… predict r, resid 生成新变量 logusq,并用它对所有解释变量做回归,得到这个回归的拟合值,再对这个拟合 值求指数函数; gen logusq=ln(r^2) reg logusq (解释变量 1) (解释变量 2)…… predict g, xb gen h=exp(g) 最后以 h 作为权重做 WLS 回归; reg (被解释变量) (解释变量 1) (解释变量 2)…… [aweight=h] 如果我们确切地知道扰动项的协方差矩阵的形式, 那么 GLS 估计是最小方差线性无偏估计, 是所有线性估计中最好的。显然它比 OLS 更有效率。虽然 GLS 有很多好处,但有一个致命 弱点:就是一般而言我们不知道扰动项的协方差矩阵,因而无法保证结果的有效性。 方法二:HC SE There are 3 kinds of HC SE (1)Huber-White Robust Standard Errors HC1, 其基本命令是: reg var1 var2 var3, robust White(1980)证明了这种方法得到的标准误是渐进可用(asymptotically valid)的。这种方 法的优点是简单,而且需要的信息少,在各种情况下都通用。缺点是损失了一些效率。这种 方法在我们日常的实证研究中是最经常使用。 (2)MacKinnon-White SE HC2,其基本命令是: reg var1 var2 var3, hc2 (3)Long-Ervin SE HC3,其基本命令是: reg var1 var2 var3, hc3约束条件检验: 如果需要检验两个变量,比如 x 与 y,之间系 数之间的关系,以检验两者系数相等为例,我们可以直接输入命令: test x=y 再如检验两者系数之和等于 1,我们可以直接输入命令: test x+y=1 如果输出结果对应的 P-Value 小于 0.05,则说明原假设显著不成立,即拒绝原假设。序列相关性问题的检验与处理序列相关性问题的检验: 首先,要保证所用的数据必须为时间序列数据。如果原数据不是时间序 列数据, 则需要进行必要的处理,最常用的方法就是: gen n=_n tsset n 这两个命令的意思是,首先要生成一个时间序列的标志变量 n(或者 t 也可以); 然后通过 tsset 命令将这个数据集定义为依据时间序列标志变量 n 定 义的时间序列数据。 最直观的检验方式是通过观察残差分布,其基本步骤是在跑完回归之后,直接输 入 Predict error, stdp 这样就得到了残差值;然后输入命令: plot error n 会得到一个 error 随 n 变化的一个散点图。 D-W 检验――对一阶自相关问题的检验: D-W 检验是对一阶自相关问题的常用检验方法,但是如果实际问题中存在高阶 序列相关性问题,则不能用这个检验方法。 D-W 检验的命令如下: 首先,输入回归命令, reg Variable1 Variable2 Variable3…VariableM 输出一个简单的 OLS 估计结果。然后,再输入命令: dwstat 这时会输出一个 DW 统计量。通过与临界值之间的比较,可以得出结论。也可 以执行如下命令 estat durbinalt 直接进行 Durbin 检验。Breusch-GodfreyTest in STATA――检验高阶序列相关性: 在得到一个基本回归结果和 error 之后,我们假设这样一个关系: et = α0 + α1 et-1 + α2 et-2 …+ αk et-p + β1 x1t + β2 x2t … +βk xkt +εt BG 检验的原假设是:H0 : α1 = α2 = … αp =0。 其基本命令是: bgodfrey , lags(p) 其中 p 是你自己设定的一个滞后项数量。如果输出的 p-value 显著小于 0.05,则 可以拒绝原假设,这就意味着模型存在 p 阶序列相关性;如果输出的 p-value 显 著大于 0.05 甚至很大,则可以接受原假设,即不存在 p 阶序列相关性。处理序列相关性问题的方法――GLS: 常用的几种 GLS 方法: (1) Cochrane-Orcutt estimator 和 Prais-Winsten estimator 其基本命令是 prais var1 var2 var3, corc (2) Newey-West standard errors 其基本命令是 newey var1 var2 var3, lag(3) 其中,lag(3)意思是对三阶序列相关性问题进行处理;如果需要对 p 阶序列相 关性问题进行处理,则为 lag(p)t 因变量,g,f,c 是自变量,_26 存放了弟 26 个观测值,为需要预测的值 reg t g f c if _n!=26 点预测 predict taxpredict if _n==26均值的区间预测 predictnl py=predict(xb),ci(lb ub) l(95)因变量的区间预测 adjust g= f=24649.95 c=99.9,stdf ci level(95)Hausman 检验是检验内生性的最常用的方法。它是通过比较一致估计 检验 量与有效估计量的 Wald 统计量。 命令格式为:.hausman name-constistent [name-efficent] [,options] 其中,name-cosistent 指一致估计的结果, name-efficent 指有效估计的结果。注意,一致、 有效估计量的先后顺序不能改变。 Option 选项: constant 计算检验统计量将常数也包括在内,默认值为排除常数 allegs 利用所有方程进行检验,默认只对第一个方程进行检验 skipeqs(eqlist) eqlist 只能以方程名称而不能以方程序号表示 equation(matchlist) 比较设定的方程。 force 即使假设条件不满足仍进行检验 df(#) 默认值为一致估计与有效估计的协方差矩阵的差的估计 sigmamore 协方差矩阵采用有效估计量的协方差矩阵 sigmaless 协方差矩阵采用一致估计量的协方差矩阵 tconsistent(string) 一致估计量的标题 tefficient(string) 有效估计量的标题工具变量估计 命令格式: .ivregress esitimator depvar [varlist1] [varlist2=varlist_iv] [if] [in] [weight][,options] 其中,estimator 包括 2sls,gmm,liml 三种。varlist1 为模型中的外生变量,varlist2 为模型中的 内生变量,varlist_iv 为模型中的工具变量。 Nonconstant 不包括常数项 Hascons 用户自己设定常数项 CMM 选项: wmatrix(wmtype) robust,cluster clustvar,hac kernel, unadjusted center 权数矩阵采用中心矩 igmm 采用迭代 GMM 估计 eps(#) 参数收敛标准。默认值为 eps(le-6) weps(#) 权数矩阵的收敛标准。默认值为 w eps(le-6) Vce(vcetype) unajusted,robust,cluster clustvar,bootstrap,jackknife,hac kernel level(#)置信区间 First 输出第一阶段的估计结果 Small 小样本下的自由度调整 .estat firststage [,all forcenonrobust] 该命令给出第一阶段的估计结果以及各种统计量,包括排除外生变量的相关性检验。 All 选项给出所有的拟合优度统计量。 如果模型存在多个内生变量, stata 给出 R2、 R2、 则 偏 调整的 R2 、F 统计量;如果模型存在多个内生变量,则 stata 给出 Shea 偏 R2 和调整的偏 R2。 forcenonrobust 给出最小特征值统计量及其临界值,即使采用稳健估计(这一检验的假 设条件是误差项为独立正态分布)。 estat overid[,lag(#) forceweights forcenonrobust] 该命令给出了过度识别约束检验。如果使用 2sls 估计估计,则 Stata 给 Sargan’s(1958)和 Basman’s(1960)卡方统计量,这也是 Wooldridge’(1995)稳健得分检验。 如果采用 liml 估计 方法,则 stata 给出 Anderson and Rubin’s(1950) 卡方统计量以及 Basmann F 统计量;如果采 用 GMM 估计,则 stata 给出 hansen’s(1982)J 统计量。Lags(#)用于计算得分检验的 HAC(异 方差自相关一致)统计量的过程中进行去噪时设定滞后阶数。如果设定 lag(0),则表示不进行 去噪处理。默认选择为 lag(1)。这一选择仅使用于 2sls 估计方法和设定 vce(hac)选项情况。 Forceweight 表示即使采用 aweights,pweights 或 iweights 也进行检验。Stata 仅对于 fweights 的情况进行检验,其他权数所得到临界值可能不准确。 Forcenonrobust 指在 2sls 或 LIML 估计中即使采用稳健标准差也进行 Sargan and Basmann 检 验(这一检验的假设的假设条件是误差项为独立正态分布)。 例子: log(wage)=a+b*educ+c*exper+d*expersq+u 怀疑模型教育(educ)具有内生性问题,利用父母接受教育的年数(fatheduc,motheduc)作 educ 的工具变量估计上述模型。 (1)利用 2SLS 估计模型 .ivregress 2sls lwage exper expersq (educ=fatheduc motheduc),first 第一阶段回归结果为: educhat=9.1+0.19fatheduc+0.16motheduc+0.05exper (21.34) (5.62) (4.39) (1.12)- 0.001expersq (-0.84) 第二阶段的估计结果为: lwagehat=0.05+0.06educ+0.04exper-0.001expersq (0.12) (1.95) (5.29) (-2.24)(2)检验 educ 的内生性 .quietly ivreg iwage exper expersq {educ=fatheduc motheduc} .est store IV_reg .quietly regress lwage exper expersq educ .est store LS_reg .hausman IV_reg LS_reg 可以得到 hausman 估计量=2.7,P 值=0.44。接受原假设,即 educ 是外生的。 (3)进行过度识别的约束检验 .estat overid 可得 Sargan 统计量=0.38,P 值=0.54 接受原假设。 面板数据估计首先对面板数据进行声明 对面板数据进行声明: 对面板数据进行声明 前面是截面单元,后面是时间标识: tsset company year tsset industry year 产生新的变量:gen newvar=human*lnrd 产生滞后变量 Gen fiscal(2)=L2.fiscal 产生差分变量 Gen fiscal(D)=D.fiscal描述性统计: 描述性统计: xtdes :对 Panel Data 截面个数、时间跨度的整体描述 Xtsum:分组内、组间和样本整体计算各个变量的基本统计量 xttab 采用列表的方式显示某个变量的分布Stata 中用于估计面板模型的主要命令 估计面板模型的主要命令:xtreg 估计面板模型的主要命令 xtreg depvar [varlist] [if exp] , model_type [level(#) ] Model type be fe re pa mle 模型Between-effects estimator Fixed-effects estimator GLS Random-effects estimator GEE population-averaged estimator Maximum-likelihood Random-effects estimator主要估计方法: xtreg: Fixed-, between- and random-effects, and population-averaged linear models xtregar:Fixed- and random-effects linear models with an AR(1) disturbance xtpcse :OLS or Prais-Winsten models with panel-corrected standard errors xtrchh :Hildreth-Houck random coefficients models xtivreg :Instrumental variables and two-stage least squares for panel-data models xtabond:Arellano-Bond linear, dynamic panel data estimator xttobit :Random-effects tobit models xtlogit : Fixed-effects, random-effects, population-averaged logit models xtprobit :Random-effects and population-averaged probit models xtfrontier :Stochastic frontier models for panel-data xtrc gdp invest culture edu sci health social admin,betaxtreg 命令的应用: 命令的应用: 声明面板数据类型:tsset sheng t 描述性统计:xtsum gdp invest sci admin 1.固定效应模型估计: xtreg gdp invest culture sci health admin techno,fe 固定效应模型中个体效应和随机干扰项的方差估计值(分别为 sigma u 和 sigma e),二者之 间的相关关系(rho) 最后一行给出了检验固定效应是否显著的 F 统计量和相应的 P 值2.随机效应模型估计: xtreg gdp invest culture sci health admin techno,re 检验随机效应模型是否优于混合 OLS 模型: 在进行随机效应回归之后,使用 xttest0 检验得到的 P 值为 0.0000,表明随机效应模型优于混合 OLS 模型 3. 最大似然估计 Ml: xtreg gdp invest culture sci health admin techno,mleHausman 检验 Hausman 检验究竟选择固定效应模型还是随机效应模型: 第一步:估计固定效应模型,存储结果 xtreg gdp invest culture sci health admin techno,fe est store fe 第二步:估计随机效应模型,存储结果 xtreg gdp invest culture sci health admin techno,re est store re 第三步:进行 hausman 检验 hausman fe Hausman 检验量为: H=(b-B)?[Var(b)-Var(B)]-1(b-B)~x2(k) Hausman 统计量服从自由度为 k 的 χ2 分布。当 H 大于一定显著水平的临界值时,我们就认 为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型 如果 hausman 检验值为负,说明的模型设定有问题,导致 Hausman 检验的基本假设得不到 满足,遗漏变量的问题,或者某些变量是非平稳等等 可以改用 hausman 检验的其他形式: hausman fe, sigmaless 对于固定效应模型的异方差检验和序列相关检验: Xtserial gdp invest culture sci health admin techno 异方差检验: xtreg gdp invest culture sci health admin techno,fe xttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model) 随机效应模型的序列相关检验: xtreg gdp invest culture sci health admin techno,re Xttest1 Xttest1 用于检验随机效应(单尾和双尾) 、一阶序列相关以及两者的联合显著 检验结果表明存在随机效应和序列相关, 而且对随机效应和序列相关的联合检验也非常显著 可以使用广义线性模型 xtgls 对异方差和序列相关进行修正: xtgls gdp invest culture sci health admin techno, panels(hetero),修正异方差 xtgls gdp invest culture sci health admin techno, panels(correlated), 修正依横截面而变化的异方 差 xtgls gdp invest culture sci health admin techno, panels(hetero) corr(ar1),修正异方差和一阶序 列相关 ar(1)
李子奈《计量经济学》第三版例题及习题的stata解答―汇集和整理大量word文档,专业文献,应用文书,考试资料,教学教材,办公文档,教程攻略,文档搜索下载下载,拥有海量中文文档库,关注高价值的实用信息,我们一直在努力,争取提供更多下载资源。

我要回帖

更多关于 stata14 破解版 的文章

 

随机推荐