・要約

災害リスク評価に用いられる手法を用いてプロ野球の投手打撃成績を分析したところ、大谷級の打撃成績を残す投手は1リーグにつきおよそ50年に一人出現すると推定された。

 

・はじめに

2017シーズンまで日本ハムファイターズに所属した大谷翔平選手は、投手としても打者としても際立った成績を残した現代プロ野球において極めて異色の選手であり、特に2016年には投手として10勝4敗防御率1.84奪三振174とエース級の成績を残しながらも打率.322本塁打22本 OPS1.004 (OPSについて詳細は後述)を記録した。日本プロ野球においては過去にも打撃にも秀でた投手が存在していたものの、彼に匹敵する打撃成績は過去に例がなく、実際「10勝、100安打、20本塁打」は史上初の快挙である。

では、彼のような突出した存在が再び日本プロ野球に現れる日は来るのだろうか。来るとしたら、それは何年後だろうか。

今回は、まだ見ぬ”大谷級の打撃センスを持った投手”について、災害リスク評価などに使用される極値統計学の観点から予測を試みる。特に、大谷が最高の打撃成績を残した2016年の値を参照し、打撃能力の指標であるOPSが1.004を超える投手が再来するまで要する年数を推定する。

 

・極値統計学とは

通常の線形回帰モデルなどは母集団の平均に関して分析するには非常に優れているが、我々は時に平均以外に関することを分析する必要がある。

例えば橋の設計について考えてみよう。いま、とある川に橋をかける計画を立てていて、大雨や強風に耐えるためにその地域ではどれぐらいの強度が必要であるか検討していると想像してみよう。この時考慮しなければならないのは、その川の平均的な水流量や平均的な風速だけではなく、100年に一度あるいは1000年に一度やってくるかもしれない超大型台風などの大災害である。極値統計学は、こうした珍しい・ごく稀にしか起こらない現象に関して、現在までに観測されているごく限られたデータを用いて推定する学問である。

 

・使用データ

私設サイト「日本プロ野球記録」から、1974-2016シーズン(43年)について通算勝利数が50を超える投手のシーズン打撃成績を全て集めた。大谷は通算42勝で、この中には入らない。年間数回しか打席にたたなかった投手の打撃成績を除外するために、シーズン打数が20を超えるデータのみを抽出し(n=914)OPS(長打率+出塁率)を計算した。OPSは、打率よりも得点との相関が高い指標として知られ、野手であれば概ね.900以上で「素晴らしい」.700で「平均的」、.566以下で「非常に悪い」と評価される。今回使用した投手においてOPSの中央値は0.3240で、平均値は0.3379 であった。 

 

なお上記条件により、分析対象となる投手はセリーグのみとなった。交流戦導入後は大谷以外のパリーグ投手も打席に立つ機会があるが、年間を通じて打数が少なく信頼できる打撃成績を得ることが難しいと判断した。

 

・モデルとパラメータ推定

先述した通り、非常に稀な現象に関して分析する場合に平均に関する情報はあまり有用ではないばかりか、推定精度を悪化させる場合がある。そこで今回のようなデータを分析する際には、以下の三つの戦略からいずれかを選ぶのが主流である(高橋・志村 2016)。

 

1. 各シーズンについて、その年最も打撃成績が良かった選手の成績のみを使用し、これが一般極値分布に従うと仮定する

2.  各シーズンについて、その年の打撃成績上位r人の成績のみを使用し、これが一般極値分布に従うと仮定する。

3.  各選手各シーズンの”打撃成績の優秀さ”について一定の閾値uを設け、その閾値を超えたデータのみを利用し、これが一般パレート分布に従うと仮定する。

 

1は最もシンプルな戦略であるが、利用できるデータサイズが小さくなるというデメリットが生じる。一方2、3は利用できるデータサイズが多少大きくなるが、rやuの選択について恣意性が入る危険もある。今回はデータサイズを確保するために3の戦略を採用した上で、高橋・志村(2016)に紹介された方法に従って閾値の設定に関する妥当性を検討した。今回はシーズンOPSが0.6を超えた投手を解析に利用する。

閾値を超えた選手のOPS成績が一般パレート分布を仮定し、尺度パラメータσ、および形状パラメータεを最尤推定した。

最尤推定されたパラメータを用いることで、

「毎年n人の投手が20打数以上打った場合、今後m年間に出現する最高OPS」は以下の式で推定される。

 

(閾値μ)+σ[(m×n×rate])^ε-1]/ε  -(1)

ここでrateは、閾値μを超えたデータの割合である。

(1)式を「m年再現レベル」と呼ぶ。簡単のため1リーグ6チームで先発ローテーションに入る投手を5人ずつと仮定し、n=30を(1)式に代入すれば(1)式は年数mについての関数となるから、2016年に大谷が記録したOPS1.004を超える投手が次に出現するまでの年数を推定できる。

 

・結果

パラメータの最尤推定値(標準誤差)は以下の通りである。

σ=0.08697019 (0.01948626)

ε=0.03479349 (0.16590750)

rate=0.04819277

 

Rの数値計算関数”uniroot”を利用して(1)式が1.004となるmを求めると、

m= 51.28135となった。

必要であれば、信頼区間の導出も可能である。

 

・考察

日本プロ野球史上において前例がないとされる大谷が50年に一度出現するとの予測結果は、直観からすると”現れすぎ”と感じられるかもしれない。この直観は、「投手としての大谷」の凄さが理由かもしれない。

本稿では解析対象を一定以上の成功を収めた投手に限定するため通算50勝以上という制限を課したが、それでもこの条件に該当する投手は378人にも達する。大谷は実働年数がまだ少ないことから通算勝利数こそまだ42勝であるものの、2015年には15勝と防御率2.24でリーグ最高の成績を残し、また2016年にも規定投球回こそ満たさなかったものの10勝と防御率1.84とリーグ随一の成績を残したほか、最高球速165キロを記録するなど投手としての能力も歴史上前例のないものである。本稿の分析ではこうした投手としての能力を検討しておらず、「投手のもつ打撃能力」という非常に偏った視点からのみ分析したことで大谷の能力を過小評価しているかもしれない。

 

試しに、今回のデータセットの中でシーズンOPSの高かった投手を3人あげてみると以下のようになる。

0.966 江夏 豊(1978)

1.009 欠端 光則(1990)

1.047 石井 茂雄(1976)

 

・参考文献

高橋・志村 (2016) "極値統計学" ISMシリーズ進化する数理統計, 近代科学社