最初の「多変量解析」をご覧になって、拒絶反応を示された方は、
このまま、スルーして下さいね。
興味ある方は、このまま、読み進めて下さい。
昨日、「多変量解析」を検索したのですが、この題目でブログを書かれた方は、
お一人だけでした。
ただ、「多変量解析」の説明はありませんでした。
他の方々は、ブログの内容に「多変量解析」を書かれていて、130人位の方々が、
書かれていました。
その方々の大半は、お医者様でした。
それではいきますね。
多変量解析(multivariate analysis)や多変量統計(multivariate statistics)とは、
統計学において、複数の独立変数(説明変数)からなる多変量データを
統計的に扱う手法の事です。
主成分分析、因子分析、クラスター分析などがあります。
一般的に、多変量解析を行なうためには、計算負荷が高く、手計算では極めて困難ですが、
コンピューターの発展により、容易に実行出来るようになりました。
最近は、共分散構造分析(「構造方程式モデリング」とも言います)が普及して
きています。
一方、探索的多変量解析で総称される各種の手法がデータミニングなどで
よく使われるようになっています。
簡単な例があります
タバコの本数、睡眠時間と寿命の関係です。
この場合、複数の独立変数(説明変数)が、タバコの本数と
睡眠時間です。
最初に難しい事を書いたのですが、例えば、この例では、
寿命をタバコ本数と睡眠時間の2つを独立変数として、
寿命を計算しようとしているのです。
中学の時に習ったと思います。
y=aX+b
これは、変数がXのみ、つまり1つです。
これが、2つ以上あるものが、「多変数(多変量)」です。
一昨日のブログにも書いたのですが、フラッシュバット溶接機は、溶接開始位置、溶接代、
前進速度、後退速度などの溶接条件を設定するのが、難しかったのです。
この時、この多変量解析と言う手法を知っていれば、トライアル時間を減らす事が
出来たと思います。
いろいろな、溶接開始位置、溶接代、前進速度、後退速度に設定し、
(行き当たりばったりではない)試作品を作れば良かったのです。
そして、引張試験を実施し、多変量解析計算結果に基づき、
引張強さ=a×溶接開始位置+b×溶接代+c×前進速度+d×後退速度
の中で、どの独立変数の影響が強いのか、目途を立てれば良かったのです。
多変量解析を学んだのは、工場勤務から他の部署に異動になったあとの
事です。(笑)