メモメモφ(．． )

memomemoφ(．． )

次のような学習データ集合 Dが与えられた場合を考える。

$\mathcal{D} = \{ (\mathbf{x}_i, c_i)|\mathbf{x}_i \in \mathbb{R}^p, c_i \in \{-1,1\}\}_{i=1}^n$

c_i は 1 もしくは -1の値を持つ変数で $\mathbf{x}_i$ が属したクラスを意味する。 $\mathbf{x}_i$ は $p$ 次元の特徴ベクトルである。

このような学習データが与えられた時 $c i = 1$ であるいくつかの点と $c i = － 1$ であるいくつかの点とを分離する

超平面をさがすのが共通の目標であるが、他のアルゴリズムと差別化される特徴は

ただいくつかの点を分離する超平面を捜すことで終わるのではなく、いくつかの点を分離することができる

幾多の候補平面の中でマージンが最大になる(maximum-margin) 超平面を探す点にある。ここで marginとは、超平面から各いくつかの点に至る距離の最小値を言い、この marginを最大にしながらいくつかの点を二つのクラスで分類しようとすると、結局クラス1に属するいくつかの点との距離の中の最小値とクラス -1に属するいくつかの点との距離の中の最小値とが等しくなるように超平面が位置しなければならず、このような超平面をマージン最大の超平面という。結論として、SVMは二つのクラスに属しているいくつかの点を分類する幾多の超平面の中で、最大限に二つのクラスのいくつかの点と距離を維持するものを探すアルゴリズムといえる。

wを重みづけ、xを入力信号(0から1まで)、しきい値をhとするとき、Hをヘヴィサイドの階段関数とするとき、

$H(\sum_{i=1}^N w_ix_i-h)$