eviews中的方差分解公式是什么
Law of Iterated Expectations (LIE)
在讲方差分解之前,我们需要先理解双期望定理。对于一个X,我们可以根据不同的Y将其任意的划分为几部分:
于是经过这样的划分,X总体的均值其实是等价于每一个划分下均值的总体均值。
举个例子,假设一***划分为三部分,每部分的均值分别为70 60 80, 于是
从理论上,
Mathematical Derivation of the Law of Total Variance
另一个重要的规则是total variance:
它刻画了方差的两个组成成分:
怎么理解呢?
什么是 直观来看,他是每个划分下方差的均值,因此,它刻画了样本内差异的均值。
什么是 它刻画了不同分组下均值的差异程度,因此,它刻画了样本间差异的程度。
因此,方差刻画了样本内和样本间差异的叠加,这就是Law of Total Variance.
与k-means聚类的联系
熟悉聚类算法的同学可能意识到,k means聚类其实有两种等价的学习方式,分别是,最小化类内距离(within-cluster sum of squares (WCSS)):
以及最大化类间距离(between-cluster sum of squares, BCSS):
显然,它们分别对应着 ? 和 ? ,因为他们加起来是等于常数(方差),因此根据全方差公式,最小化前者等价于最大化后者。
与最小二乘法的联系
所谓最小二乘法,其实就是搜索最优的 ? :
其中
可以发现,当 ? 的时候,右边的那项将消失,因此条件期望就是最优的 ? ,
因为回归其实也可以直观上理解为一种最小化样本内差异的方法。