lowverのブログ -10ページ目

lowverのブログ

lowverのブログです。あまり更新されないかもしれません・・・(^^;;

http://ameblo.jp/miumalovely/entry-11162399563.html
相変わらずこの方は長打と打点の話ばかりですが、「それも打撃能力なんだから、仕方ないんです。(中略)打率だけで話をするよりマシでしょう。」とのことです。
打率だけで話をするのも、長打と打点だけで話をするのも一面的であることは同じなのですが。

上記の記事では、セイバーメトリクス(OPS)について、その元となる長打率がシングルヒットでも上がってしまうからおかしい、という批判をしていました。セイバーメトリクスでも古典的な指標でも欠点はあるわけで、何が評価されていて、何が評価されていないのかをきちんと踏まえて解釈することがデータを見る上では重要です。
今日はセイバーメトリクスの一つの見方を紹介したいと思います。

さて、この方も他のアンチイチローの方もよく批判している内容として
(1)打点が少ない
(2)長打が少ない
(3)内野安打の比率が大きい
といったものがあります。これらは正しいですが、一方で
(4)打率や出塁率が高い
(5)三振が少ない
(6)盗塁が多い(盗塁成功率も高い)
といったプラスの要素もあります。

これらを個々に見ていただけでは全体としてどう評価すべきが見えてきません。
そこで、これらをチームの得点への寄与という観点からどう捉えるべきか考えてみたいと思います。
そのために、RE24という指標を取り上げてみます。

次の表を見てください。(出典:Tangotiger, Run Expectancy Matrix, 1999-2002

0アウト1アウト2アウト
ランナー無0.5550.2970.117
ランナー1塁0.9530.5730.251
ランナー2塁1.1890.7250.344
ランナー3塁1.4820.9830.387
ランナー1・2塁1.5730.9710.466
ランナー1・3塁1.9041.2430.538
ランナー2・3塁2.0521.4670.634
ランナー満塁2.4171.6500.815

これは1999年~2002年の状況別の得点期待値を集計したものです。
上記4年間で、1アウトランナー2塁の状況からは平均して0.725点が入った(逆に言えば0.725点が期待できる)、という見方をします。

この表から、プレーの前後で得点期待値がどう変わったかを見ることで、そのプレーが何点の価値があったかを見ることができます。
例えば、1アウトランナー2塁からヒットを打って1点入り、打者走者が1塁に残ったとします。
・ヒットを打つ前の得点期待値:0.725(1アウトランナー2塁)
・ヒットを打った後の得点期待値:0.573(1アウトランナー1塁)
・実際に入った得点:1点
上記よりヒットの価値は、1(実際の得点)+0.573(プレー後)-0.725(プレー前)=0.848と計算します。
打点であれば1ですが、元々ランナー2塁だったのが1塁の状態にしてしまった分、割り引かれているわけです。

もう1つ例を出すと、回の先頭バッターが2塁打を打つと、それは1.189-0.555=0.634の価値があるプレーだということです。
このように見ることで、プレーを得点への寄与に換算することができます。これを累計したものがRE24です。

ちなみに、RE24の"RE"はrun expectancy(得点期待値)の略で、24は上記の表が24マスあることに由来しているようです。

この観点を元に、(1)-(6)が何を意味するか見てみたいと思います。

(1)の打点は、打ったことによって実際に入った得点を表していますが、ランナー無から打ったホームランと、ランナー3塁からの犠牲フライが同じように1とカウントされてしまいます。チームへの得点の寄与という観点からすると、RE24のようにプレーの前後で状況がどう変わったかを見る方が適しています。
(2)の長打が少ないというのは、自身やランナーを一気に進めるバッティングが少ないため、その分RE24が上がりにくくなるわけですから、RE24の評価に反映されます。
(3)の内野安打についても、外野へのシングルヒットに比べれば塁上のランナーを進塁させる効果が少ない(例えば内野安打で1塁ランナーが3塁に進むことは稀でしょう)ため、RE24の上がり方は少なく、やはりRE24に反映されると考えられます。
一方で(4)の打率や出塁率が高ければ、チャンスを作ったりチャンスを広げたりすることが多いですからRE24を押し上げるでしょう。(5)の三振が少ないというのは、普通の凡打の場合はゴロの間にランナーが進んだりフライでタッチアップしたりといった進塁効果でRE24を上げるのに対して、三振にはほとんど進塁効果がなくRE24を上げません(むしろ下げる)から、この要素もRE24に反映されています。
(6)も自身が進塁するのですからRE24に反映されます。

要するにRE24を見ることで、(1)~(6)が得点への寄与という観点で総合的にどう見るかがわかるのです。
実際の値は、実はすでに
日本人メジャーリーガーの成績を評価する
で計算しています。

これを見ると、イチローのRE24は累積値で見ても、単位打席あたりの獲得率で見ても上位20%以内には入っているレベルであることがわかります。
つまり、(1)~(3)だけを見て「得点に貢献できていない」と批判をするというのは、的外れだということです。
批判するにしてもせいぜい、(4)~(6)が(1)~(3)によって割り引かれて、上位20%レベルに留まっている、というレベルでしょうか。

さて、RE24にも欠点はあります。
例えば、
・打席に立ったときにランナーが多い方が値が増えやすい
・RE24では点の重みが評価されない(接戦での場面と大差の場面の違いなど)
などです。特に前者は打点が持つ状況依存性と同じ欠点です。しかしながら、今回のように(1)~(6)を総合的にどう見るかというように、目的に応じて使うことは可能なのです。
欠点があるから使えない、というのではなく、適切にデータを見ていく必要があります。
これはもちろんセイバーメトリクスや野球の指標に留まらず、あらゆる統計について言えることです。
その統計が何を意味するかをよく見て考えることが重要です。
いつものブログで今度は津田の批判記事がありました。
http://ameblo.jp/miumalovely/entry-11132547757.html
今回は、この津田批判記事が、いつものイチロー批判記事と大矛盾しているということを指摘したいと思います。

記事中では、津田批判の根拠として、記録としては真っ先に防御率を挙げています。

まず、防御率で判断するという事自体が、普段のイチロー批判の時と矛盾していることを示しましょう。
防御率は、9イニング(27アウト)あたりの自責点です。
では自責点とは何か。
ルール上、細かい決まりはいろいろありますが、注目すべきはイニングの途中で交代した場合の取り扱いです。
例えば投手P→投手Qに交代したとして、
(1) 投手Pが打者Aに二塁打を打たれる
(2) 交代した投手Qが打者Bにヒットを打たれ、Aが生還する
という状況を考えます。
この場合、自責点はランナーを出した投手Pにつきます。
つまり、防御率というのは点を与えるきっかけになった(1)を重視する指標です。
一方で、攻撃側から見ると打者(走者)Aには得点が、打者Bには打点がつきます。

例のブログのイチロー批判の記事では、
http://ameblo.jp/miumalovely/entry-10591081830.html
このように、得点よりも打点を重視する主張をしています。
(1)は重要ではなく、(2)のプレーが重要だ、と述べているのです。

つまり、イチロー批判の記事では(1)は重要ではないと言っているにもかかわらず、津田批判をするときは(1)を重要視する防御率という指標を真っ先に持ち出す時点で矛盾をしているのです。

これが第一の矛盾点です。
ただ、投手の指標はそれほど多くないため、やむなく防御率を出さざるを得なかったという弁護はあるかもしれません。
しかし、もっと致命的な大矛盾が潜んでいます。
津田の通算防御率は3.31ですが、これについて、記事中では「防御率はかなり悪いですね」と述べています。
これが致命的な大矛盾です。

なぜ大矛盾なのか?
これを説明するために、イチローがチームの得点をどれだけ稼いでいるかを見てみたいと思います。
防御率は先にも述べたように9イニング(27アウト)あたりの自責点ですから、攻撃側から見ると27アウトあたりで何点挙げられるかという観点となります。これは、セイバーメトリクスで言うRC27の観点ですので、防御率とRC27を比較してみる、ということが考えられます。
しかし、より矛盾点を明確にするために、氏が信奉する打点を使って比較してみたいと思います。
イチローが27アウトあたり何打点稼いでいるかを見てみます。
まず、イチローが稼いだ打点ですが、2011年終了時点で、日米通算1134打点です。
ではアウトをどれだけ献上したかを見てみます。
総アウト数=打数-安打数+犠打数+犠飛数+盗塁死数+併殺打数
     =11075-3706+37+60+128+116
     =7710
これより、27アウトあたりで何打点稼いでいるかが求まります。
1134*27/7710 = 3.97

もう矛盾点にお気づきですね。

http://ameblo.jp/miumalovely/day-20100807.html
を見ると「イチローは自らのバットで、チームに点をもたらすことが事実上、出来ない」と述べられています。
イチローは27アウトあたり3.97打点を稼いでいるわけですが、これが「チームに点をもたらすことが事実上、出来ない」というのであれば、27アウトあたり3.31の自責点しかない津田は「事実上相手チームに点を与えていない」レベルのはずですが、氏には「防御率はかなり悪い」と見えているのです。
逆に、防御率3.31がかなり悪いのであれば、イチローが27アウトあたり3.97打点(しかも得点ではなく打点で計算しているにもかかわらずです)稼いでいるのは、「かなり稼いでいる」ことになるはずです。
これが第二の矛盾点です。

つまり、氏はデータを示して議論しているつもりなのでしょうが、評価の軸も基準も矛盾だらけであったということがわかります。
先日来ウォッチしているブログですが、また不思議な記事がありました。
記事1:http://ameblo.jp/miumalovely/entry-11071288673.html

この記事では「客観的なイチローの評価」を知るために、以下の記事を紹介しています。
記事2:http://d.hatena.ne.jp/lp6ac4/20081127

記事2では、『プロ野球 最強選手ランキング』という書籍から、歴代の野手ランキングを掲載しています。それによると、イチローは64位となっていました。

このランキングを見て、記事1では「思ったより、順位(評価)が低い」と述べています。
その考察として「イチローの最大の欠点は多くの打数を消化する割りに、本塁打が打てないのとランナーを還せない」としています。

残念ながら記事2のランキングは、何らこの考察の裏付けになっていないことを証明します。

記事2によると、このランキングは以下の基準で算出されています。
(A) 打撃の実績を得点換算したRC
(B) その値を守備位置により補正
(C) さらにその値をその年々の傾向により補正

他のサイトの情報からすると、さらに
(D) 通算の値に全盛期7年の値を加算
の要素が加わっているかもしれません。

それぞれの意味を考えてみます。

まず(A)ですが、いわゆるセイバーメトリクスでもよく使用されているRCです。打点や得点はその個人の能力以外の要素も絡んでくるため、純粋にその打者個人がどれだけチームの得点に寄与できているかを評価しようとする指標です。主に出塁と進塁(長打や盗塁等)が評価されます。
値としては打点や得点と同じく、基本的には試合数や打数が増えるにしたがって増えていく累積的な値となります。
つまり、全く同じ能力の選手であっても、長年在籍した選手の方がランクが上がることになります。

次に(B)ですが、守備力が期待されるポジションでは値を大きく(捕手は×1.23、遊撃手は×1.14等)補正し、守備よりも攻撃力が求められるポジションでは値を小さく(一塁手は×0.86、指名打者は×0.74等)補正されます。外野手は一律×0.96です。
注意すべきなのは、「守備能力」ではなく「守備位置」によって補正されているということです。つまり、守備の名手でも守備に難があっても同じ守備位置なら同じように補正されているということです。

次に(C)です。年代によって投高打低であったりその逆であったりと、記録が出やすい年、出にくい年があります。これを標準化して、年代の異なる選手を同じ尺度で評価するようにする補正となります。

最後に(D)です。これは、入団してから引退するまでコンスタントに活躍した選手よりも、全盛期に際立った活躍をした選手を高めに評価しようとする補正と考えられます。

さて、記事2のランキングの意味を理解したところで、イチローの64位というのを改めて考えてみます。
イチローは2001年にMLBに渡りました。したがって、NPBでの成績は2000年で止まっています。NPB時代は通算9年4098打席での記録となるわけです。
一方、上位10位の選手を見てみると、豊田が7215打席と若干少なめですが、それ以外は皆8800打席超で、野村に至っては11970打席での記録です。
2倍、下手をすると3倍近い打席数の差があるのですから、累積系の指標であるRCは必然的にそれだけ差がつくことになります。
もちろん打席数に差があっても、ハイペースでRCを稼げば順位は上がります。ただ、これだけ打席数に差がある中での64位であることを見て「イチローの最大の欠点は多くの打数を消化する割りに、本塁打が打てないのとランナーを還せない」などという根拠には全くならないことはおわかりいただけるかと思います。
例えて言うと、同じ累積系の記録として「安打数」があります。イチローのNPB時代の安打数1278は、現時点で歴代176位です。NPB時代、あれだけ高打率で安打を打ってきたのに176位です。しかし、この順位を見て「イチローは打数を消化する割に安打が打てなかった」などと思う人はいないでしょう。それと同じことです。

記事1の筆者は、記事2のランキングが累積系のランキングだと気付かなかったために、何の裏付けにもなっていないイチロー批判を書いてしまったのです。累積系のランキングだと思わなかったという証拠として、メジャーの成績を含めるとランキングが「かなり下がると思います」と書いていることも挙げられます。
累積系の指標なのですから(しかもRCはまずマイナスにはならない指標ですから)、メジャーの分を足せば順位が下がることなどはあり得ないというのは自明のことです。それを「かなり下がると思います」と書いているということは、率系の指標に基づくランキングと誤解していると考えられます。

ここまで書いたところで、1つ気になるデータがあります。
記事2のランキングの17位に松井秀喜が入っていることです。松井もイチローと同じくNPBからMLBに渡っているため、NPBでの試合数や打席数は少ない中での17位ということになります。これを見ると、「ほら、やはり松井のようにハイペースで稼げばちゃんとランキングに入ってくる」と思われるかもしれません。
まず、具体的に松井の打席数を見ると5506です。イチローよりも1408打席多い数字です。なので、同じペースで稼いだとしてもそれだけ松井の方が上に来ることになるわけですから、イチローより上にいるからと言ってこのランキングだけでは松井がハイペースだったとは結論付けられません。
では実際にペースはどうだったのか?
参考としてRC27という指標があります。これは27アウトの間にどれだけRCを稼ぐことができるかという、RCを率系の指標にしたものです。これを比べることによっておおよそのペースの比較ができます。
http://www16.plala.or.jp/dousaku/rc27.html
ここにRC27傑出度というランキングがあります。これはRC27を(C)のように年代の補正をしたランキングです。これによると、イチローの順位は松井よりもむしろ上です。つまり、イチローの方が松井よりもハイペースでRCを稼いでいたと考えられるわけです。
イチローと松井の1408打席という差は約2~3年でカバーできる数字です。
仮にイチローがあと3年日本で同じペースでプレーしていたと仮定しましょう。

イチローと松井を比較した場合、ほぼ同じ年代の選手で、守備位置も同じ外野でしたから、(B)と(C)ではほとんど差がつきません。
(A)では先ほど見たとおりイチローの方がハイペースであることがわかりました。
残りは(D)ですが、松井は2001年,2002年とかなりの活躍をしましたから松井の方が若干有利かと考えられます。

こうしてみると、イチローがあと3年日本で同じペースでプレーしていた場合、(A)と(D)がある程度相殺されると考えれば松井と同じ17位前後の順位まで上がってきていたと考えられることがわかるわけです。

記事2に書かれている「メジャーの成績を加味したら間違いなく三人(イチロー、松井、松坂)ともベスト10には入るだろうね」というコメントは、あながち間違ってもいないと考えられます。

さて、記事1の筆者が記事2のランキングを見誤って、何の裏付けもないイチロー批判に走ったことはわかりました。
では、記事2のランキングはどう読むべきだったのでしょうか?
ここまで読んだ方ならお分かりかと思いますが、記事2のランキングがイチローについて述べていることは、RC(守備位置、年代補正、全盛期補正込み)で見るとイチローがNPBで残した「実績」が64位である、というそれだけのことなのです。

記事1の筆者のように、ペースがどうかを見たいのであれば、途中で紹介したRC27傑出度ランキングのような率系のランキングで比較するのが良いのでしょうが、アンチイチローの立場の方としてはおそらく都合が悪いランキングなのでなかなか持ち出しにくいのでしょうね。