さて,前回までは回帰分析により得られた勝率予測式について検証してきました.
ところで,このeWin%の近似式を眺めていてあることにお気付きになりましたでしょうか?
そうです,得点と失点の係数が違う,ということです.
eWin% = 0.444 + 0.00078×(得点数) - 0.00069×(失点数)
ということは,得点の方が失点よりも強く勝率に影響する?
...というわけにも(これだけでは)言えません.これはただの偏回帰係数ですから,変数のオーダーの影響を受けます.
(まあ,得点と失点なんだからオーダー変わらんだろと言われるとそうなんですが)
そこで,今回は回帰式の補正決定係数と各変数の標準回帰係数を用いてズバリ「勝率により強く影響している要素はどっちなのか?」を検証したいと思います.
●得失点を比較して,「攻守のバランス」を検証する
「野球は投手」「打てないチームは上に行けない」などなど,野球の攻守バランスについては様々な言説があります.
しかしいずれにせよ,それは「得点を上げる」ことを目的にしているのか,「失点を減らす」ことを目的にしているのかの2つに分けて考えることができるでしょう.
そこでここでは得点/失点と勝率の間の標準偏回帰係数を求め勝率に影響する強さを考えようと思います.
データ対象はこれまで通り,143試合制である2015-2018年の4シーズンです.
まず4シーズンのべ48チームの勝率,得点,失点の3要素を標準化しました.
これを用いて回帰分析し勝率,得点,失点の標準偏回帰係数は以下のように求められました.
またeWin%の回帰分析において得失点を用いたeWin%の回帰式の補正決定係数は0.877でしたので,この2つの解析から勝率は以下のような要素に分解することができました.
ということで,得点が失点に対してより大きく勝率に関わっているようだという結果が出てきました.
ただしこれだけを以て「失点を1点減らすよりも得点を1点増やした方が勝率は2倍よくなる」とはならないということは記しておきます.
これは標準化した上での回帰係数の比較による寄与率の分割という行為を行っていますから,これは偏差値による話をしているのだと理解していただく必要があります(厳密には偏差値でもないのですが).
すなわち、得点の偏差値を1上げるのと失点の偏差値を1下げるのとでは得点を増やす方がより強く勝率に寄与するということになります.ただこの偏差値1にあたるのが一体何点なのか?というのはそれぞれのリーグ・シーズンごとに変わるのでそこは各々算出しなければならないということになります.
また2つの要素の標準化した相関係数を検証してみると,恐ろしいまでのp値を以て有意に得点の方が強く勝率に相関していることは示されますので現代のNPBにおいては攻撃が守備よりも優先される要素である,と言うことはできるかと思います.
今回は得点/失点の二項対立により,野球の攻守のバランスを検証しました.
次回からはさらに詳しく成分を分け,「どのようなチーム編成を目指すか?」ということに切り込んでいきたいと思います.