外れ値に強い線形回帰 2020-10-30 math python 外れ値が多いデータに対して線形回帰をするために、Scikit-learnにはHuberRegressorというクラスがある。 ϵϵというハイパーパラメータを持ち、 |y−Xw|σ>ϵ|y−Xw|σ>ϵ の場合には2乗誤差、そうでない場合には絶対値誤差を最小にする σ,wσ,w を学習する。 数学的には、あんまり遠いデータは正規分布ではなくて両側指数分布に従うと思うことにする、ということを言っているのと同じと思われる。