LARS、LARS-EN では、目的変数 X に加えデータ y も中心化(X については更に規格化)されている事が要請されました。
データ y が中心化、即ち sum_i y_i = 0 で無い場合、解くべき方程式は
となり、解βの他に切片 b が必要になります。
ここで 1 は 1 = (1, 1, ... , 1) なる n 次元ベクトルです。
なので目的関数も
式(5)
となります。
これを coordinate descent で解く場合、まず変数の一つである b 以外、即ち β を固定して b についての勾配を求めると
なので
となります。当然のことですが・・・
あ、 ここで
です。上の b は L1 正則を課しても変わりません。当然ですが・・・
次に式(5)の β_j についての勾配から
を解いて
が得られますが
なので X が中心化していればこれは 0 です。つまりX が中心化されていれば、 y が中心化されているか否かに関わらず解の更新式は
となります。当然ですが・・・