本日は投手成績と能力値の相関について記事にしたいと思います。
相関係数についての細かい説明は避けますが、
気になるかたは以下のサイトを参考にしてみてください。
0.7~1.0:強い相関がある
0.4~0.7:相関がある
0.2~0.4:やや相関がある
0.0~0.2:ほぼ相関がない
こんな感じの数値で、マイナスの場合は逆相関があることになります。
※「球速値が高いほど三振が多い」場合は相関として現れ、相関が強いほど+1に近づいていきます。
※「コントロールが高いほど与四球が少ない」場合は逆相関として現れ、逆相関が強いほど-1に近づいていきます。
※「変化球値とWHIPが関係ない」場合は相関がないと現れ、相関が弱いほど±0に近づいていきます。
では、前置きはここまでとしてデータをご紹介します。
「素」と「補正」とありますが、「補正」は元々のデータに対して、
こちらの記事にあるような補正係数を掛けて得られた数値です。
K/9は1試合あたりの奪三振数、
BB/9は1試合あたりの与四球数、
H/9は1試合あたりの被安打数、
HR/9は1試合あたりの被本塁打数です。
表の見方ですが、数字が赤いと相関があって、
セルが赤いと強い相関があることを示しています。
一番気になる防御率ですが、球速や変化球との相関は薄く、
コントロールと相関があることが分かります。
コントロールは防御率以外にも、WHIPや与四球率と強い逆相関があることが分かります。
一方、コントロールは奪三振率とは相関が薄いです。
奪三振率は球速及び変化球計と相関があることが分かります。
球速が速いと何故か被本塁打が多いという謎の数値が出てしまいました。
逆相関なら分かるんですが…何故でしょう…。
変化球については奪三振と被安打率と相関がありますが、何故か四球も増えるようです。
合計値(スタミナを除いてます)については、素のデータと補正値で結構差が出ています。
補正値のデータの方が信頼できそうというか、感覚に近い気がしますね。
ちなみにデータの取り方ですが、こんな感じで作っております。
こちらは防御率と各能力の相関を出した時のデータです。
データの元は、投球回数が200回を超えている下記の8名を参照しています。