python3年生を読み進めています。
データーを用意するのところ
<sample3−1>
from sklearn.datasets import make_blobs
# ランダムの種が「0」で、特徴量は2つ、塊数は2つ、ばらつき1の、300個のデータセット
X, y = make_blobs(
random_state=0,
n_features=2,
centers=2,
cluster_std=1,
n_samples=300)
random_state=0 これは乱数の種を0にしているので 変えてみたところで問題なし
n_features=2 特徴量は2つ 2次元座標で表すため。 増やしても今回は意味なし
centers =2 塊が2 らしいこれは変更して見てみねば
=2の場合
赤と青の境目がわかりやすくて学習には良さげですね
でも あえてcenter=5にしたらどうかというと
こんな感じにバラけて、境目はこっちのほうが引きやすそうですが
集団としての信頼性はかけそうですね
cluster_std=1 ばらつきの度合い これも=5にしてみました
これはあまりにもばらつきすぎて、境目がわからなくなるようです。