外れ値が多いデータに対して線形回帰をするために、Scikit-learnにはHuberRegressorというクラスがある。

ϵというハイパーパラメータを持ち、

|yXw|σ>ϵ

の場合には2乗誤差、そうでない場合には絶対値誤差を最小にする σ,w を学習する。

数学的には、あんまり遠いデータは正規分布ではなくて両側指数分布に従うと思うことにする、ということを言っているのと同じと思われる。