はっきりさせておきたいのですが、今シーズンのアーセナルの統計をまとめる作業は、最初は情熱から始めたわけではなく、ただ…腹が立ったから始めたんです!Tin Arsenal
義理の弟はリヴァプールファンなのですが、私をからかってきました。アーセナルが勝ったり好調だったりするたびに、「ああ、ただの運だよ。シーズンが終われば2位になるだろう。xG(期待ゴール数)の統計を見ろよ。データは嘘をつかない」と言っていました。私はその話を長い間聞いていてうんざりしてきました。経済学を専攻し、鋭い推論力を持っていた彼に反論することもできませんでした。そこで私は、「よし、データで遊ぼう!」と決意しました。自分の好きなチームがどんなプレーをしているのか、何か本当に良い点がないか、自分でデータを集めて確認しなければならなかったのです。
データ抽出と「手動」データ入力のプロセス
最初は、オンラインで数回入力するだけで簡単に結果が出ると思っていました。大手統計サイトではVIPアカウントの登録が必要だったり、マトリックスのような複雑なインターフェースが必要だったりするなんて、誰が想像したでしょうか。私はそういった複雑な手順が嫌いなので、考えを変えて「古典的な」方法に切り替えました。
今シーズンのアーセナルの試合統計(興味深い点)
私は各試合のデータを掘り下げる旅を始めました。
ステップ1:5~6つの異なるスポーツウェブサイトを開きます。それぞれのサイトは特定の分野に強みを持っています。あるサイトはボールポゼッション率を明確に示し、あるサイトはシュート数に特化し、あるサイトはカードとファウルにのみ焦点を当てています。
ステップ2:「武器」として、使いにくいGoogleスプレッドシート(インターネット上のExcelファイル)を用意します。私は専門的なツールは一切使いません。目標はスプレッドシートを作成することです。
ステップ3:手でコピー、手でコピー、そして手でコピー。シーズン開始以来のアーセナルの試合リストを開き、列ごとに、ボックスごとに、ボールポゼッション、正確なパス数、シュート数、枠内シュート数、xG(幸いにもこれを明記したページがありました)、タックル成功数…といったデータを並べてみました。エラーを避けるために、各試合について3~4つの異なるソースからコピーして比較する必要がありました。この作業は本当に苦痛でした。マウスをクリックし、キーをひたすら押し続け、目がくらみました。データ収集だけで週末のほぼ2晩を費やしました。
まあ、私は歯を食いしばってそれをやり遂げました。これはチームファンの名誉のためであり、奇妙なデータエンジニアリングの仕事のためではないと考えて。
生の分析と「良い」発見
雑然としたデータをすべてスプレッドシートファイルにまとめた後、簡単な数学関数をいくつか使い始めました。SUM、AVERAGEといった基本的な関数です。私のルールは、物事を複雑にしすぎないことです。シーズンを通して平均を計算するだけで、義理の弟と話すのに十分です。
そして、私が発見した「良い」発見は次のとおりです。
発見1:真の守護天使。確かにゴール数は明らかですが、再計算してみると、アーセナル戦のxG(期待ゴール数)が他のトップチームと比べて大幅に低いことがわかりました。これは、ゴールキーパーがセーブする必要はあったものの、ブロックするミッドフィルダーによる守備システムが非常に効果的に機能していたことを意味します。アーセナルは幸運だっただけでなく、相手にチャンスを作り出すことに非常に長けていました。これはコーチングチームの功績と言えるでしょう。
発見2:致命的な弱点。しかし、近距離シュートやチャンスのコンバージョン率の統計を見ると、アーセナルは依然として無駄が多すぎることが分かります。xG(ゴール創出)はかなり高いものの、実際のゴール数は期待を下回ることがよくあります(時期によっては)。これは義兄がよく言う意見を裏付けるものですが、今、正確なデータを得て改めて言えるようになりました。「確かに無駄はありますが、創出されたチャンスはすでに素晴らしいのです!」
発見3:沈黙を守る「チームの運び屋」。キーパスのデータと、3~4人のキープレーヤーが直接ゴールに関与した回数も除外してみました。データは大きく異なっています。ハードワークし、精力的に走りながらも、プレスにはあまり登場しない選手もいます。しかし、統計は彼らがチームの骨組みを支える釘であることを示しています。
物語の終わりと個人的な満足感
合計900個近くのデータセルを含む緻密な統計表を完成させ、私は安堵のため息をつきました。ついに、対抗するための究極の武器を手に入れたのです。
Sheetsファイルを義兄に送りました。彼は1時間ほど沈黙していました。それから電話をかけ直し、少し落ち込んだ声でこう言いました。「よくやった。アーセナルの守備は今年、格段に良くなった。データは嘘をつかない」
ほら!理屈で、数字で勝つ感覚は、言葉で勝つ感覚よりもはるかに楽しい。正直に言うと、一つ一つの数字をじっくり分析するのは、疲れるし、大変だけど、全体像が見えてきて、サッカー観戦中に感情に左右されなくなった。自分のチームの強みと弱みがわかるようになった。
今では、アーセナルの試合が終わるたびにSheetsファイルを開き、1行ずつ更新する。もう習慣になっている。もう誰かと議論する必要はなく、自分の統計表に満足するだけでいい。最初は意地悪で始めたこの統計作業は、今ではサッカーを愛する叔父の優雅な趣味となっている。
統計をやりたい兄弟たちのために、このプロセスを共有します。手作業の方法を恐れずに、とにかくやってみてください。時には自分でやって、自分で掘り出すのが一番です!
