数据统计分析软件Stata 17新版本发布!

Stata是统计软件包,可提供数据分析,数据管理和图形制作。Stata 17版本已发布,新版本的Stata具有新功能—共有29个亮点。Stata 17可以在Apple的新型M1 Mac(称为Apple Silicon)上运行。Stata作为通用应用程序提供,它具有在M1 Mac和基于Intel的Macs上本机运行能。

 

Stata 17新增功能有:

 

表格

 

 

可自定义的表格

现在,Stata随时可以帮助您创建标准表和自定义表,您想要的是Web上的表

 

 

或在Word®中的表格看起来像这样,

 

 

或用于LaTeX的同一张表格,

 

 

您可以直接从重新构想的表命令创建不同的表-从的交叉表一直到比较回归表。

 

新的表格命令如何执行这些操作?Stata 17 使您能够访问该系统。它建立在的系统之上,该系统可从命令中收集存储的结果并将这些结果显示为表格。

 

收集系统具有一定的复杂性。

 

功能样式是可自行设计的您可以为经常创建的表格的类型设计自己的样式。设计样式后,将该样式应用于收集的结果即可创建表格,系统内具有布局,格式和外观的表格。您也可以使用Stata随附的样式或同事创建的样式。

 

贝叶斯计量经济学

 

贝叶斯计量经济学使用贝叶斯原理研究经济关系。

       如,额外一年的受教育可能会增加工资吗?那些参加职业培训计划的人是否更有可能在未来五年继续受雇?低违约组合的违约概率是多少?贝叶斯范式中可以回答这些问题,贝叶斯范式可以估计感兴趣的假设可能性。

 

您可以在Stata 17的新贝叶斯计量经济学功能中找到贝叶斯VAR模型以及贝叶斯线性和非线性DSGE模型,以及更多功能:

 

贝叶斯VAR模型

贝叶斯IRF和FEVD分析

贝叶斯动态预测

贝叶斯纵向/面板数据模型

贝叶斯线性和非线性DSGE模型

 

PyStata-Python和Stata

 

 

PyStata可从Python环境直接调用Stata并直接从Stata调用Python,从而大大扩展了Stata的Python功能。

 

PyStata的新功能

 

1. 具有从IPython内核相关环境(如Jupyter Notebook,Spyder IDE或PyCharm IDE)使用Stata的能力:

2. 具有从Python Shell使用Stata的能力,例如,Windows命令提示符,macOS终端或Unix终端;

3. 三个IPython命令:stata,mata和pystata;

4. 一组来自Python的API函数,用于运行Stata命令以及访问Stata数据和返回的结果。

 

这些工具与Stata功能接口(sfi)模块一起,使用户可以使用Python的将Stata的大量统计和数据管理方法到数据科学项目中。

 

Jupyter Notebok与Stata

 

 

Jupyter Notebook是功能易于使用的Web应用程序,它使您可以在单个文档(“notebook”)中执行代码,可视化,数学方程式和公式,叙述文本以及媒体组合在一起,以进行交互式计算和开发。

 

现在,您可以使用Ipython(交互式Python)内核从Jupyter Notebook中调用Stata和Mata,在相同环境中结合使用Python和Stata的功能,以使您的工作可复制和与他人共享。

 

双重差分(DID)和DDD模型(Difference-in-differences(DID) and DDD models)

 

 

Stata的新didregress和xtdidregress命令适合用于控制未观察到的组或受时间影响的DID和DDD模型。didregress可以与重复的横截面数据一起使用,在该数据中,在不同的时间点采样了不同的观测单位。stdidregress用于面板(纵向)数据。这些命令提供了框架来获取适用于研究设计的推论。

 

双重差分(DID)提供了一种非实验性技术,可以通过对照组和治疗组的结果平均值之间的时间差异来估算对被治疗者(ATET)的平均治疗效果。因此,名称上的差异也不同。该技术控制了无法观察到的时间和群体,这些混淆了治疗对结果的影响。

 

双重差分(DDD)在DID框架中添加了控制组,以解决DID可能无法捕获的不可观察的组和时间交互。它为新的对照组增加了DID的区别。因此,名字的区别就在于双重差分。

 

治疗效果和示例检查药物治疗对血压的影响,外科手术对行动能力的影响,就业培训计划或销售广告活动的影响。

 

Stata值和速度

 

Stata值和速度。两者之间通常需要权衡取舍,但Stata正在不断和改进例程,以利用现代计算能力和算法,以使Stata运行得更快。

 

在Stata 17中,更新了排序和折叠后面的算法,以使这些命令更快。因为sort命令由Stata命令使用,所以这些命令也更快。排序速度快1.5倍到6倍。如下面的表1所示。例如,有了1000万个观测值和20个变量,Stata/SE 17中的时间从Stata/SE 16中的近20秒降低到了3秒!

 

表1:对20个变量和不同观察值和版本组合的Stata 17与Stata 16的计时,以秒为单位。

 

 

该崩溃命令创建汇总统计的数据集,是常用的数据管理命令之一。随着数据大小的增长,运行时也如此。在Stata 17中,根据数据集的大小,对于均值的计算,崩溃会6到13倍的加速,而对于中位数和标准差之类的统计数据的计算,崩溃会提高40到70倍。表2显示了在计算中位数和标准差的情况下,将具有10,000,000个观察值和变化数量的折叠变量折叠起来的数据集的结果。

 

表2:不同变量编号和版本组合的10,000,000个观测值的状态17和16时序,以秒为单位。

 

 

对于Stata 17,还提高了速度已进行估算。现在,基于Mata的功能和运算符的线性代数软件包(LAPACK)由Intel Math Kernel Library(MKL)提供。如,新的MKL快多少? 在Stata/SE中,将5,000×5000实矩阵与相同维度的实矩阵相乘,在Stata 17中使用MKL大约需要13秒,而在Stata 16中则需要70秒。

 

两个实数矩阵相乘的时间(以秒为单位):

 

 

cholesky()的时间(以秒为单位):

 

 

LAPACK在估计命令中用于计算,因此它们也自动更快。

 

现在,可以在Stata/MP中并行使用于从CSV带分隔符的文本文件导入数据的import分隔命令。它在Stata 17中以高达四倍的速度导入大型数据集。

 

区间删失Cox模型

 

 

在Stata 17中,新的估算命令stintcox将半参数Cox比例模型拟合到间隔检查的事件时间数据。该命令可以分析检查类型的数据,当前状态数据,其中已知的事件在观察的时间之前或之后发生。它还分层。

 

单变量(Multivariate meta-analysis

 

 

单变量meta-analysis处理研究报告的单一效应。在实践中,很多情况下研究可能会报告多种效应大小。例如,酮饮食,高蛋白饮食,素食饮食或间歇性禁食是否能达到大的减肥效果?这些比较中的每都会产生效果大小。分别对效果进行建模会忽略它们可能相关的事实。Multivariate meta-analysis共同对效应进行建模,并说明其依赖性。

 

贝叶斯VAR模型

 

 

VAR模型已知具有模型:具有K个结果变量和p个滞后,有K(pK+1)个参数。

 

您可以使用新的Bayes:var命令来拟合贝叶斯VAR模型,该模型通过合并有关模型参数的先前信息来帮助克服这些问题。通常使参数估计稳定。

 

贝叶斯多层次建模

 

 

使用多级模型来建模于组的效果,这种效果可能出现在不同层次的层次上。贝叶斯分析的标准好处之外,贝叶斯多级建模还为具有少量组或面板的数据提供了数据。原则方法,通过使用效果后验分布来比较不同组之间的效果。

 

bayesmh新的随机效应语法,可拟合贝叶斯多级模型。它为装配新类型的多层模型打开了大门。拟合单变量线性和非线性多级模型。现在,您可以拟合多元线性和非线性多级模型!

 

想想混合效应非线性模型的拟合通过menl,或一些SEM模型作为适合通过SEM和gsem,含有随机效应多元非线性模型。现在,您可以使用bayesmh来适应这些模型的贝叶斯对应模型,更多。

 

使用LASSO估计治疗效果

 

 

使用治疗效果估计量从观测数据中得出因果推论。也许您想估计药物治疗对血压的影响,外科手术对流动性的影响,培训计划对就业的影响或活动对销售的影响。

 

当您对几个协变量进行推理而控制潜在协变量时,可以使用LASSO推理估计器。

 

现在,您可以同时使用这些估算器。使用新的telasso命令,控制潜在协变量的同时估算治疗效果。

 

日期和时间新功能

 

 

在Stata和Mata中添加了一组日期时间函数,以,方便的处理日期时间,以(1)计算持续时间,例如年龄和日期时间差异;(2)查找相对日期,例如给定日期之后的下生日;(3)提取Stata日期时间值和变量的分量。

 

Leave-one-out-meta-analysis

 

 

Leave-one-out-meta-analysis通过在每次分析中排除一项研究来执行多种meta-analysis。研究通常会产生不同的效应大小,这可能会改变整体结果。Leave-one-out meta-analysis可用于调查每项研究对总体效应量估计值的影响并确定有影响力的研究。

 

您现在可以通过使用新的执行Leave-one-out meta-analysis leaveoneout与选项元总结和元树状图。

 

Galbraith图

 

 

Galbraith图是一种图形化的方式来介绍您的meta-analysis的历史记录。它们提供有关研究效果大小,其精度,总体效果大小以及检测潜在异常值的信息,评估效应量之间的异质性。

 

面板数据多项式logit模型

 

 

多项式logit(MNL)模型是用于对没有自然排序的分类结果进行建模,这些结果是诸如职业,政党或参观选择之类的结果。

 

Stata的新xtmlogit命令适用于随时间推移观察到的分类结果的随机效应和条件固定效应MNL模型。

 

贝叶斯纵向/面板数据模型

 

 

通过前缀您的经典面板数据模型拟合贝叶斯纵向/面板数据模型贝叶斯。因为面板数据模型可以看作两层的层次模型,所以贝叶斯多层次建模适用于面板数据模型。

 

零膨胀有序logit模型

 

 

Stata的新ziologit命令适合零膨胀的有序loggit模型。

 

有序logit回归用于对有序的分类反应建模,例如,记录为无,轻度,中度或严重的症状严重程度。此类有序结果的较大值用于标记,但数值无关紧要。

 

趋势的非参数检验

 

 

趋势测试涉及有序组中的响应。他们测试了响应值在各组之间是趋于增加还是降低。

 

当少量数据且无协变量可供控制时,通常使用趋势测试,需要在小样本中产生p值的测试。nptrend可以选择基于Monte Carlo排列或排列分布枚举来计算的p值(后者适用于很小的样本)。

 

nptrend对趋势执行四种不同的测试:

 

Cochran-Armitage test

Jonckheere-Terpstra test

Linear-by-linear test

Cuzick's test with ranks

 

贝叶斯IRF和FEVD分析

 

 

脉冲响应函数(IRF),动态乘数函数和预测误差分解(FEVD)通常用于描述多元时间序列模型(如VAR和DSGE模型)的结果。这些模型可能具有参数,可能难以解释。IRF和功能将多个参数的影响合并为摘要(时间段)。例如,IRF测量变量(如通货膨胀率)的冲击(变化)对给定结果变量(如失业率)的影响。

 

在Stata 17中,可以使用新的bayesirf命令执行贝叶斯IRF分析。

 

贝叶斯动态预测

 

 

在拟合多元时间序列模型(例如向量自回归(VAR)模型)之后,动态预测是一种常见的预测工具。它通过使用先前时间的预测结果值来预测当前时间的结果值。在使用bayes:var命令拟合贝叶斯VAR模型之后,新的bayesfcast命令计算贝叶斯动态预测。

 

LASSO与集群数据

 

 

现在,您可以在LASSO分析中考虑集群数据。忽略聚类可能会错误结果,因为同一聚类中的观测值之间存在相关性。但是,借助Stata的LASSO命令(用于预测和推理),您现在可以获得说明聚类的结果。

 

使用BIC选择Lasso变量参数

 

 

变量参数的选择是Lasso分析的基础。选择小的变量参数,您就有可能在模型中太多变量。选择大的变量,您可能或排除一些变量。

 

现在,我们可以使用贝叶斯信息准则(BIC)在与Lasso相关的命令中选择变量参数进行预测和推理。

 

为了进行预测,可以通过小化Lasso,elasticnet和sqrtlasso中的BIC来选择变量参数。为了进行推断,还可以通过小化dsregress,dslogit,dspoisson,porgress,pologit,popoisson,poivregress,xporegress,xpologit,xpopoisson,xpoivregress和telasso。

 

Lasso与BIC变量参数选择后,绘制BIC函数,该函数在变量参数网格上显示BIC准则的值。

 

贝叶斯线性和非线性DSGE模型

 

 

贝叶斯前缀现在的命令DSGE和dsgenl以适应贝叶斯线性和非线性动态随机常规均衡(DSGE)模型。

 

DSGE模型在宏观经济学和金融学中应用,可以对多个时间序列进行建模。这些模型描述经济过程的线性或非线性方程组。DSGE模型的参数通常在经济理论的背景下具有直接的解释能力,并且具有合理范围。这些范围(或约束)应纳入估算中以获得稳定的结果。

 

贝叶斯估计提供可以通过为满足约束条件的模型参数指定先验分布来合并此类约束条件。

 

档案编辑器中的新功能

 

 

现在,Stata的“文件”编辑器中提供了Java和XML的语法突出显示以及引号,括号和所选内容括号的自动补全功能。

 

可以通过书签注释**#来声明书签。您可以使用GUI通过单击当前do文件的书签边距来添加或删除书签。Stata将插入一行带有书签注释的行,并在页边空白处显示书签图标。或者,您可以的在您的文件中键入书签注释。在书签的行中添加文本会将标签添加到书签。因为书签只是一种注释,可以与您的do文件一起保存。

 

Stata的“文件”编辑器导航控件,该控件列出了文件中的书签。从导航控件中选择书签,将文件编辑器移至该书签的行。还记得如何通过在书签注释后添加文本来标记书签吗?书签的标签显示在导航控件中,以标识您的书签。除了书签之外,导航控件还显示do文件中涵盖程序,您可以使用它直接进入程序的定义。

 

Stata on Apple Silicon

 

 

适用于Mac和Stata 17可作为通用应用程序使用。同一应用程序将在装有Apple Silicon的Mac和装有Intel处理器的Mac上本机运行。如果您拥有Intel Mac并计划使用Apple Silicon到新的Mac,则从旧Mac迁移到新Mac,Stata就可以使用-重新安装Stata或下载应用程序。

 

Intel数学内核库(MKL)

 

 

Stata 17通过在兼容硬件(涵盖基于Intel和AMD的64位计算机)上使用Intel Math Kernel Library (MKL)通过了深度的LAPACK例程。

 

Java

 

现在,您可以直接在Stata中嵌入并执行Java代码。以前,您可以在Stata中创建和使用Java插件,但这需要您编译代码并将其捆绑到JAR文件中。您仍然可以执行此操作,现在您也可以直接在do文件,ado文件中以交互方式编写Java代码。您编写的Java代码可以即时编译-外部编译器!可以编写并行化的代码以利用多个内核。

 

随附的Stata功能接口(sfi)Java软件包提供了Stata与Java之间的双向连接。

 

Stata将Java开发工具包(JDK)与其安装捆绑在一起,因此不涉及设置。该版本的StataJava 11,这是当前的长期(LTS)版本。

 

H2O

 

在Stata 17中请尝试连接H2O。H2O是可扩展的分布式开源机器学习和预测分析平台。

 

使用JDBC连接到数据库

 

将Stata与数据库连接,JDBC可与数据库供应商交换数据,例如,Oracle,MySQL,Amazon Redshift,Snowflake,Microsoft SQL Server等。JDBC是跨平台的解决方案,所以JDBC设置适用于Windows,Mac和Unix系统相同。安装了JDBC驱动程序,要将该驱动程序和Stata代码从Mac笔记本电脑切换到公司的Windows云系统即可。

 

 

 

查看Stata软件详情

热门产品

2021-04-21 16:52
首页    新闻资讯    普通新闻    数据统计分析软件Stata 17新版本发布!