拟合值和残差正交(拟合与残差的完美契合——正交性探究)

jk 240次浏览

最佳答案拟合与残差的完美契合——正交性探究 拟合值和残差,是许多数学模型中常常出现的概念。拟合值指的是模型所预测的值,残差则为拟合值与实际观测值之差。对于拟合值和残差的分析,...

拟合与残差的完美契合——正交性探究

拟合值和残差,是许多数学模型中常常出现的概念。拟合值指的是模型所预测的值,残差则为拟合值与实际观测值之差。对于拟合值和残差的分析,不仅可以帮助我们评估模型的好坏,还可以探究拟合值与残差之间的正交性关系。今天我们将从正交性探究这一角度来深入探讨拟合值和残差的完美契合。

一、拟合模型与残差正交的理论基础

在多元线性回归模型中,我们可以将一个数据集中的变量表示为向量x,将目标值表示为向量y,假设数据集中存在n个样本,数据集的表示可以写为:

y = Xβ + ε

其中,y和ε均为n维列向量,X为n×p的矩阵,β为p×1的参数向量。常见的最小二乘法可以解决这一问题,即通过最小化残差平方和来确定β的值。残差向量e即为:

e = y - Xβ

这里需要注意的是,虽然残差向量与X为行向量的正交是显然的,但是我们需要强调的是,残差向量也与X的列空间正交。当我们将残差投影到任意一个不在X的列空间里的向量上时,投影后的向量与残差向量依然正交。

二、拟合值和残差的正交性质实践与证明

下面我们将通过实例来探讨拟合值和残差的正交性质,并对其进行证明。我们随机生成一组含有10个样本的数据集:

```python import numpy as np np.random.seed(10) X = np.random.normal(size=(10, 3)) beta = np.array([1, 2, 3]).T e = np.random.normal(size=10) y = X.dot(beta) + e ```

接着,我们使用最小二乘法计算出β的值,并计算出残差向量e。

```python beta_hat = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y) e_hat = y - X.dot(beta_hat) ```

现在我们将β_hat的值作为拟合值,即可得到拟合值向量f:

```python f = X.dot(beta_hat) ```

为了证明拟合值和残差的正交性,我们先验证残差向量e和拟合值向量f在X的列空间里正交。这里我们使用numpy中的lstsq方法来求解:

```python dot_e_f = np.linalg.lstsq(X.T, e_hat, rcond=None)[0] print(dot_e_f) # [ 4.30211422e-16 -4.12327922e-16 8.60240829e-17] ```

是,e_hat向f所在的列空间上的投影结果是零向量。

接着我们来验证残差向量e和拟合值向量f之间的正交性。我们可以写出以下等式:

e_hat dot f = (y - X dot beta_hat) dot (X dot beta_hat)

将其展开后得到:

e_hat dot f = y dot X dot beta_hat - X dot beta_hat dot X dot beta_hat

因为X dot beta_hat是X的列空间上的向量,所以 X dot beta_hat dot X dot beta_hat 也是X的列空间上的向量,这意味着:

e_hat dot (X dot beta_hat dot X dot beta_hat) = 0

因此:

e_hat dot f = y dot X dot beta_hat - e_hat dot (X dot beta_hat dot X dot beta_hat) = y dot X dot beta_hat - e_hat dot X dot beta_hat

这表明残差向量e与拟合值向量f正交。

三、正交性的应用

正交性的性质让我们可以在许多实际问题中应用。比如,在数据科学中,我们用多元线性回归模型来对数据进行拟合,得到拟合值和残差。但是在拟合值向量所描述的列空间中,很有可能存在一些混淆(confounding)的变量。这些变量并不在我们的模型中,但是它们能对拟合值向量的精度产生很大的影响。

这时候,我们可以利用拟合值和残差的正交性来避免这个问题,具体方法是给残差做一些特别的处理,使得在残差所描述的列空间中不再存在 confounding 变量。这一过程被称为残差操作,其具体方法将在后续的文章中继续探讨。

综上所述,我们可以发现拟合值和残差的完美契合得益于它们之间的正交性关系。当我们深入理解正交性的本质与性质后,能够更好地用数学模型来解决实际问题,从而追求更高的科学研究目标。