[Causal Inference] Frisch-Waugh-Lovell定理与遗漏变量偏差

从事实证研究的朋友们或许都曾注意到这样一个现象:调整多元回归模型【注:时常看到有人讨论“多元回归”、“多变量回归”、“多重回归”、“多因素回归”等词汇使用的适当性,认为多元回归和多变量回归是指存在多个被解释变量的回归模型,其余则是指仅存在一个被解释变量的回归模型。事实上,依个人愚见,在不产生歧义的前提下,此类“名实之辩”大可不必。例如,本文中我使用“多元回归”一词,但是只要稍加阅读,相信没有人会认为我是在讨论存在多个被解释变量的回归模型。】中的协变量后,感兴趣的解释变量的系数发生了改变,或者说,增加或减少至少一个解释变量,模型中所有解释变量的系数与之前不同。原因在于,多元回归中任一解释变量的系数实际上是该解释变量剔除了模型中其他解释变量对自身的影响后与被解释变量剔除了模型中其他解释变量的影响后的二元回归的系数。换言之,多元回归中任一解释变量的系数其实是“该解释变量为其他解释变量所不能解释…

1   计量理论

向均值回归:从Galton的研究谈起

“回归(Regression)”一词在实证研究的语境中,一般用于表示解释变量与被解释变量之间存在的不确定性关系。然而,如果将时光流转回200年前,“回归”一词的含义与如今为实证研究者所熟稔的“回归”却颇为不同。该词最早出自英国生物学家Galton在19世纪开展的关于父母与子代身高的遗传问题的研究。1885年,通过允诺保密并提供奖金的方式,Galton获得了205对夫妇及其928名成年子女遗传特征的相关数据,其中自然也包括身高。利用身高数据,Galton撰写了一系列有关遗传学的论文,其中最著名的便是1886年发表的《Regression Towards Mediocrity in Hereditary…

1   计量理论

[Causal Inference] 潜在结果框架(下)

上一期文章讨论了潜在结果框架的核心概念,希望你阅读后有所收获。正所谓“知者行之始,行者知之成”,本期将分析一个真实的研究案例以帮助你加深对潜在结果框架和随机化实验的理解。创作不易,转载请注明出处。   20世纪80年代,美国政府在田纳西州组织开展了一次大规模的随机实验,称作Tennessee Student Teacher Achievement Ratio (STAR)…

0   计量理论

[CuPy for Machine Learning] Logistic分类器

本文是Cupy for Machine Learning系列的第二期,主要讨论用于分类任务的Logistic回归模型。源码已同步至GitHub,同时包括之前代码在内均添加了文档字符串。你可以查看更新日志获取项目的最新信息。如果你在阅读过程中有任何疑问或建议,欢迎在文后评论留言。创作不易,转载请注明出处。 1. Logistic回归 线性模型(Linear Model)是机器学习中应用最为广泛的模型,即通过样本特征的线性组合来进行预测的模型。线性模型不仅可以用于回归任务——例如上一期文章中介绍的线性回归模型和岭回归模型,亦可用于分类任务。用于分类任务的线性模型被称作线性分类器(Linear Classifier)。常见的线性分类器包括Logistic回归、Softmax回归、感知机(Perception)和支持向量机(Support Vector…

0   机器学习

栈、队列、链表和树及其JavaScript实现

上一期文章介绍了四种常用的数据结构及其Python实现过程。本期将焦点从Python转向JavaScript,依然围绕栈(Stack)、队列(Queue)、链表(Linked List)和树(Tree)四种ADT展开讨论。之所以"旧瓶装新酒",是我认为Python和JavaScript之间存在着一些有趣的差异,尽管相较于JAVA或C#,它们之间的共性更为突出。本文主要探讨两点:(一)基于类(Classical)和基于原型(Prototypical)的面向对象语言;(二)ES6之后JavaScript在面向对象编程方面的新特性。通过两期文章的对比,希望可以为你理解动态语言的异质性提供一点点的帮助。那末闲话少叙,让我们直奔主题。  …

3   编程开发

栈、队列、链表和树及其Python实现

阴晴圆缺都休说,且喜人间好时节。祝各位中秋快乐!   本文将介绍四种常用的数据结构以及它们在Python中的实现,包括栈(Stack),队列(Queue),链表(Linked List)和树(Tree)。开始之前,需要区分两个概念: 抽象数据类型(Abstract Data Type;ADT)和数据结构(Data Structure)。前者是数据结构的"蓝本(Blueprint)",它规定了数据结构必须具备的操作;后者则是抽象数据类型的实现(Implementation),它可以被定义为一组具有结构化方法的数据元素集合,这些方法使得存储和组织数据的过程变得更加高效。那末闲话少叙,让我们直奔主题。   栈…

0   编程开发

Flask-Milligram 0.1.0 已发布, 欢迎使用

文档示例程序PyPI