一些关于最小二乘法

现在的位置: 首页 > 综合 > 正文

RSS

一些关于最小二乘法

2019年04月01日 ⁄ 综合 ⁄ 共 1018字 ⁄ 字号小中大 ⁄ 评论关闭

(原创文章，转载请注明出处)

今天在回头看logistic回归的时候，无意中看到了最小二乘法，突然之间好像对概率的一些基本概念有了一层新的了解，下面就来总结下这个问题。

假设我讨论的是个简单的线性回归，

$y=\theta ^{T}\cdot \vec{x}$

y为output, $\vec{x}$ 为input， $\theta ^{T}$ 为我要训练的参数，可以看出这是一个最简答的线性回归。

由于训练集的数量多于参数的个数，所以我训练的参数即使是用训练集来测试的话也是有误差的，最后的解空间肯定要投影到我的这个列空间(详见mit线性代数公开课)，这里扯远了，我假设误差为 $\xi$ 。我假设有M个训练样本，对于第i个样本，显然有这样的公式成立

$y^{(i)}=\theta ^{T}\cdot \vec{x^{(i)}} + \xi ^{(i)}$

这里我需要做个假设了，假设 $\xi ^{(i)}$ 是服从高斯分布的,即 $\xi ^{(i)}\sim N\left ( 0,\delta ^{2} \right )$

其实这里有一个之前我一直理解不好的概念，就是概率论的第一章讲述那个σ-代数，只是我这里就是这样认为的，就是对于这个样本点的 $\xi$ ，它是不确定的，但是是在一个区间中可以取值的，而在这个区间中，它显然是以一定的概率取到这个区间中某一个值的。而 $\xi$ 这里就是一个类似随机变量(不太清楚可不可以叫做随机变量)，而这个取值的概率显然就是它的概率分布了。我这样理解了之后，就会假设这个取值的概率分布是服从高斯分布的(世间万物冥冥之中都会服从高斯分布嘛！)。

则公式话表示上面这个就是

$p\left ( \xi ^{\left ( i \right )} \right )=\frac{1}{\sqrt{2\cdot \pi }}\cdot exp(-\frac{(\xi ^{(i)})^{2}}{2\delta ^{2}} )$