ナショナルバイアスに関する長文分析記事 | siennaのブログ 〜羽生君応援ブログ〜

siennaのブログ 〜羽生君応援ブログ〜

羽生結弦選手の現役時代をリアルタイムで体験できる幸運に心から感謝しつつ、彼のスケートのここが好きあそこが好きと書き連ね、ついでにフィギュアにも詳しくなろうと頑張る欧州住まいのブログ主です。

昨日ハーシュさんが、先日の中国ジャッジ処分の件に関する記事を上げていましたね。まだちらっとしか読んでいませんが、平昌男子フリーで採点が問題になった米ジャッジについて、彼女に対する警告の有無をISUに問い合わせたとのこと。ISUからハーシュさんへの回答の通り、警告状を出したかどうかについてISUは公表しないことになっています。だからこの件についても結局分からないのですが、警告が4回(!)重なると降格などの処分対象になるという規定(p.63 Rule 440)があります。

 

今回はこれに関連した内容の記事を英語のニュースサイトから紹介します。今年2月に出た長文記事で、時間のある時にちょこちょこ訳していました。

 

このニュースサイトの日本語版で抄訳も上がっているのでぜひクリックして読んでいただきたいのですが、興味深い記事だけに全文訳がないのは残念だと思い、敢えてアップしてみます。読み進んで行くとかなり衝撃的な証言も出てきますし、どう受け止めるかは人によって違うでしょう。この記事、オフィシャルらは匿名扱いになっているものの、個人的には信頼のおける分析と広い取材に基づく誠実な内容だという印象を受けました。選手の名前も出てきますが、ナショナルバイアスは畢竟、システム全体に根っこを持つ問題。個々の選手にはなんの罪もないと信じます。

 

この記事は五輪前にアップされましたが、五輪後も、実際の採点がどうだったかをレポートするフォローアップの記事が出ています。そちらもできればご紹介したいと考えています。

 

 

 

 

自国選手を贔屓するトップレベルのフィギュアスケート審判たち。平昌五輪にも多数の派遣

 

原文はこちら

 

BuzzFeed News/John Templon, Rosalind Adams 

2018/02/9 

 

フィギュアスケートのトップレベルでは自国選手を贔屓する採点が行われ、それが最終結果に影響するケースもあることが、編集部のデータ分析で分かった。自国選手アゲが顕著とされたジャッジのうち16人が、今週平昌で五輪史の流れを決める。

 

 今週韓国に集結するトップスケーターたち。ジャンプやスピンを武器に五輪の栄光を目指す彼らだが、その成績を決めるのはトリプルアクセルの質だけではないかもしれない。編集部の調査によると、この競技のトップレベルにおいて、選手は自国ジャッジから有利な採点を受けやすい。

 

 この調査は、第一線で活躍する統計学専門家3人の協力を得て、1年以上に及ぶフィギュアスケートの採点データを分析したもの。自国選手に有利な採点を行うジャッジの数が相当数に上ることが分かった。自国選手アゲは、アメリカやロシアといったフィギュア大国のジャッジの間で常態化している。平昌に派遣予定のジャッジ46人のうち16人のホームバイアスは特に際立っており、それが偶然に起こる確率は10万分の1に満たない。この16人には、ロシア人ジャッジ全3名、中国人ジャッジ3名、カナダ人とアメリカ人のジャッジ各2名が含まれる。

 

 これまで噂止まりだったホームバイアスだが、それが競技に与える悪影響が今回の統計学的分析によりはじめて十二分に立証された。接戦の場合、たった1人のジャッジの採点が最終順位を変えることもあり得る。

 

 現役および引退ジャッジ、コーチ、選手ら20人以上の関係者に取材を行う中で、関係者たちがホームバイアス採点に懸念を抱いていることが分かった。「ナショナルバイアスの傾向は明らかだ」。こう断言するのは、昨秋、同問題へのより厳しい取り組みを求める提言をISUに提出したオランダスケート連盟だ。この提言は、6月開催のISU総会で話し合われる。

 

 同提言の作成に当たったオランダ人ジャッジ、ジェロエン・プリンス氏によると、ナショナルバイアスは「十分にチェックしきれていない」。「多くの人々が懸念を抱いている。なぜならば、採点競技には信頼性が必要だからだ」

 

 競技スタイルの好みの地域性やジャッジが個人的に注目してきた選手への思い入れ、あるいはシンプルに愛国心が採点に反映することもある。そのため、自国選手を有利にすることを狙って故意に点数を上げたと断定することはできない。自らのホームバイアスのかかった採点傾向に無自覚なジャッジもいるかもしれない。今回の取材では、ソルトレークシティのスキャンダル以降、採点のクオリティは上がったとする関係者も多かった。

 

 現旧オフィシャルらは、ジャッジの任命を所属連盟に一任するというシステム自体に問題の核が含まれると指摘する。五輪に派遣するアメリカ人ジャッジを任命するのはアメリカの連盟であり、ロシアについても同様だ。オフィシャルらの考えでは、このシステムがナショナルバイアスを生む土壌なのだ。もしもジャッジが「不興を買うようなことをすれば、連盟はそのジャッジの代わりに他のジャッジを任命するだけだ」とアメリカの元トップ選手、トム・ガーバーは指摘する。

 

 ISUサイドは、編集部による分析に関してコメントの発表やジャッジの評価・懲罰方法に関する問い合わせへの回答を拒み、「全てのISU競技会の採点は厳密にモニタリングされており、評価および報告のプロセスは申し分ない」「ミスを犯したり点数を盛ったりしたジャッジは警告を受け、ISUによるペナルティーの対象となり得る」といった内容の簡潔なコメントを寄せた。現職オフィシャルらによると、今シーズンISUは、ジャッジ評価の際「バイアス」についてチェックするよう求めていたという。

 

 ISUの評価手続きにおいて1つの要(かなめ)とされるのが、同一パネル内の他ジャッジの平均を中心とした上下のバッファ・ゾーン(コリドー/廊下)から外れた採点を行ったジャッジにフラグを立てるアルゴリズムだ。だが、ジャッジの査定や懲罰の決定に関わっていた元ISU幹部役員2名によると、このアルゴリズムはコリドー幅の設定が広すぎるため極端な値しか検出しないという。編集部はISUのアルゴリズムを再現し、そういった主張を検証してみた。その結果、スコアがフラグ付けされることは非常にまれだということが分かった。

 

 さらに、ISUのシステムでは一度に1つの演技しか評価しないため、複数の試合で自国選手に地味な上げ採点を続けるジャッジを発見することはできない。

 

 同僚ジャッジらのスコアを写し取っていると見える場面を捕らえた映像が元で発覚した2011年のイタリア人ジャッジの例など、重大ケースを除いてはISUは警告や処罰を下してもそれを公表はしない。今回の分析で自国選手上げのパターンが認められたジャッジについて、ISUがバイアスを理由に処罰したケースは一つとして知られていない。

 

 何十年にもわたってISUで活動してきた元幹部オフィシャルらのうち半ダースに上る人々が、ジャッジの自国贔屓をコントロールすることは難しかったと認めている。そのうち1人は「これを修正しない限り収拾がつかなくなる恐れがある」と述べる。

 

 国際ジャッジらをモニターする委員会の元メンバーは「誰だって自国選手が表彰台に上るのを見たい。自分もジャッジだったころは自国選手を一段高いところに置いたものだ」と話した。

 

 

表:平昌五輪派遣のホームバイアスジャッジ

 

編集部は、個々のジャッジのスコアが公表されるようになった2016年シーズンから17年12月までのフィギュアスケート採点を分析、同一パネルの他ジャッジの平均スコアを上回る点数を繰り返し自国選手らに与えたジャッジについて調べた。これら平昌に選出されたジャッジ16人のホームバイアスは極めて顕著なものであり、偶発の確率は10万分の1に満たない。ただし、個々のジャッジがそのスコアを出すに至った背景や、点数が他ジャッジより高いことを意識していたかどうかについては、数字だけでは説明できない。

 

カナダ:Nicole Leblanc-Richard Jeffrey Lukasik

中国:Weiguang Chen Feng Huang Tianyi Zhang

イスラエル:Anna Kantor

イタリア:Walter Toigo

カザフスタン:Yuri Guskov

ロシア:Maira Abasova Elena Fomina Olga Kozhemiakina

スペイン:Marta Olozagarre

トルコ:Tanay Ozkan

アメリカ:Lorrie A. Parker Sharon Rogers

ウズベキスタン:Saodat Numanova

 

 

10万分の1の確率

 

 ISUは10年以上にわたり採点の記録にあたってジャッジを匿名としてきたが、16/17シーズンを境にどのジャッジがどの点数をつけたかを明らかにする方式に戻った。ISUは「匿名制の廃止により採点のクオリティのみならずバイアスもチェックできる」というステートメントを出した。

 

 編集部では、この変更の実施以降17年12月までの全主要大会の採点データを収集し、各ジャッジのスコアについて当人以外のジャッジ全員のスコアから取った平均値との差異を調べた(分析の詳細についてはこちら)。

 

 その結果、ホームバイアスはジャッジ全員ではないが広範囲で認められた。1600超の演技を分析した結果、平均3.4ポイントの自国上げがあった。プログラムにもよるが、前回五輪のスコアの範囲は40点台から220点超まで。そこに占める割合は小さくても、このわずかな点数が最終結果を書き換えることがある。

 

 ホームバイアスが見られたのは、男女シングル、ペア、アイスダンスの全カテゴリー。特に強豪国で顕著だった。中国のジャッジには平均4.6点の自国選手上げが見られた。これは今回分析の対象となったデータセット中、50件以上の自国選手採点例のある国々の中で最大だ。また、イタリア、ロシア、アメリカ、カナダにそれぞれ3.4点以上の自国選手上げが認められた。

 

表:ホームとは、点数を出してくれる場所

 

ホームバイアスは強豪国で目立つ。同一国所属ジャッジ全員による自国選手アゲ採点の平均を挙げる。

 

中国:4.6点

イタリア:4.1点

ロシア:4.0点

アメリカ:3.5点

カナダ:3.5点

フランス:2.7点

日本:2.4点

(2016年10月〜2017年12月の期間中行われたトップレベル競技会において少なくとも50件の自国選手採点を行った国のみ)

 

 この統計的分析では、ジャッジの能力や各演技の適正スコアを判断することはできない。我々のアルゴリズムで分かるのは、あるジャッジが自国選手の同じ演技を採点した他ジャッジ全員の平均値よりも高い点数を与えることがパターン化しているかどうかだ。

 

 我々は故意にハードルを高く設定した。我々のホームバイアスリスト入りを果たしたのは、偶発率が10万分の1以下とされるほど習慣的かつ顕著な自国上げが認められたジャッジのみだ。つまり、自国選手アゲが2〜3回だけならば、いくらその上げ幅が大きくてもリスト入りはしていない。

 

 もちろん、この統計から自国アゲの原因を探ることはできない。現・旧ジャッジとのインタビューからは、多くの要因が絡んでいることが伺えた。ジャッジの出身地域で一般的とされるスケーティングスタイルを好むという要素もあれば、成長過程を見てきた国内選手のプログラムには国内大会から馴染んでいるという要素もある。こういったことが全て自国アゲにつながる可能性を持っている。ある元ジャッジによると、自国選手らの朝食の内容まで把握しているジャッジもいるという。

 

 さらに、ジャッジは、技術・芸術面で多岐にわたる採点を、スローモーションリプレイの助けなしにリアルタイムで行わねばならない。これは簡単なことではない。ジャッジが座る位置ですら演技の見え方に影響し採点を左右する可能性がある。ホームバイアスが認められたジャッジが、ジャンプなどのエレメンツ評価に長けている場合もある。我々のインタビューに応えたオフィシャルらによると、(リスト入りした)27人のジャッジの中には、技術に関する鋭い眼と公正さで知られる人物が含まれるという。

 

 一方、より悪質なケースもありそうだ。少なくとも3人の現職および元ジャッジが、ジャッジらが結託して特定の国々を下げつつ別の国々を上げることがあると語った。コーチやジャッジはしばしば、時に暗に、時にあからさまに自国選手のためにロビー活動をするが、特定選手のスコアが前もってほぼ決められているケースがあるというのだ。

 

 別の女性ジャッジは「パネル内で5〜6人のジャッジが採点幅などについて取り決めをしている場合がある」と説明する。その場合、その取り決めに参加していないジャッジの採点が浮くため、「実際はそうでないのにそちらにバイアスがかかっているように見える」。

 

ジャッジたち

 

 (注:内容的な繰り返しは編集して翻訳します)この分析でホームバイアスが顕著とされた27人のジャッジの出身国は計10カ国。国際ジャッジとしてのキャリアはまだ数年というジャッジもいれば、何十年も続けているジャッジもいる。

 

 これら27人のうち16人が平昌五輪ジャッジに選出された

 

 編集部はこの27人全員に対し各国連盟を通じてコメントの要請を行った。その他にも電話やメール、FB、メッセージを使って個別のコンタクトも試みた。アメリカと中国の連盟はコメントを拒んた。

 

 カナダ連盟の広報担当者からは「平昌五輪派遣についてISUに申請したカナダ人ジャッジは全員評価基準を満たしており、ISUの規定ルールに従いジャッジ認定を受けている」とのメール回答があった。ロシアの連盟の代表者は質問への回答を拒否した上で、「当連盟所属ジャッジらはコメントを希望していない」とした。

 

 ジャッジの大半はメッセージに反応せず記録に残る形で話すことを避けた。平昌派遣ジャッジ中、唯一コメントを寄せたのはイタリアのワルター・トイゴ氏だ。氏は、これとは関係のない件(他のジャッジの点数を写し取っているところを目撃された)で、2年の資格停止処分を受けたことがある。だが、我々の分析において彼は別の理由で目立っていた。彼は自国選手らに平均7.5ポイントというアドバンテージを与えていたのだ。これは我々のジャッジリストの中でも最大だ。「意見は人それぞれ。我々は自分が見たものをジャッジする」とトイゴ氏は言った。「我々は人間であって機械ではない。私は自分の考えで採点する。どのスケーターにも一貫した採点をするよう心がけている」

 

 この27人中、トイゴ氏の資格停止処分(氏自身は処分に納得していない)以外にISUから公けに処分を受けたジャッジはいない。

 

新採点システム

 

 02年ソルトレークシティ五輪で採点スキャンダルが明るみに出てISUが痛手を負ったことから、採点システムの徹底的な見直しが行われた。

 

 採点の主観性を低減するため、ISUはプログラムの技術面をより重視することにした。それまでは0から6までの数字を二つ出せばよかったのが、今はジャンプ、スピン、ステップシークエンスをはじめ全てのエレメンツを個別に-3から+3までの尺度で評価している。それと同時に5種のコンポーネンツも採点する。スケーターの最終スコアは、プログラムの難度とジャッジパネルの平均に基づく複雑な計算からはじき出される。各要素の最低点と最高点は、極端な数値の影響を弱めるためにカットされる。

 

 02年のスキャンダルと新採点システムの導入以来、このスポーツは大幅に浄化されたとISUフィギュアスケート担当スポーツダイレクターのチャールズ・Cyr氏は言う。「今のジャッジたちは新世代。15〜20年前の旧世代ジャッジらは引退し、いなくなった。お国のために、という時代遅れの考えと共に」

 

 だが、新採点システムが様々な改善をもたらした一方で、透明性は後退してしまった。自国連盟によるプレッシャーからジャッジを守るという意見を元に、採点を匿名制としたのである。

 

 「匿名制はISUの犯したミスの中でも最悪のもの」と話すのは、ジャッジや技術委員長を務め、ISU殿堂入りをしたソニア・ビアンケッティ氏。匿名制のせいで採点ミスなのかナショナルバイアスなのかを特定することがほぼ不可能になったという。それは、70年代、ナショナルバイアスを繰り返していたソビエトのジャッジ全員を、ビアンケッティ氏の尽力で1シーズンの間資格停止にすることに成功したケースに比べ、あまりの変わり様だった。

 

 14年ソチ五輪でロシアのソトニコワが韓国のキムを破り金メダルを獲得したが、その直後にバックステージでロシア人ジャッジの1人がソトニコワをハグした場面は大きな騒動を引き起こした。そのジャッジは元ロシアスケート連盟会長の配偶者でもあった。韓国スケート連盟はロシア側が同ジャッジを任命したことを倫理条項違反だと非難したが、ISUはこれを退けた。

 

 それから2年後の16年、ドゥブロニク(クロアチア)で開催されたISU総会において匿名制の廃止がほぼ満場一致で採択された。「次々にジャッジが立ち上がり、マイクに向かって「私は自分の採点に説明責任を負いたい」と述べた」と語るのは12年全米王者で現ISU技術員会メンバーのジョン・コフリンだ。「良いジャッジに隠し事はない」

 

「マークされることはほぼない」

 

 ISUはエラーやバイアスの疑いのある採点をキャッチするための独自のアルゴリズムを持っているが、複数のインサイダーによると、これが効果的ではない。

 

 「許容範囲が広すぎて、マークされることは事実上ない」とISU技術員会の元メンバーは言う。

 

 「ジャッジはその範囲の中に留まるようなやり方を心得ている」と話すのは別の元技術委員会メンバーだ。

 

 「ISUの設定する許容範囲にはかなりの幅がある」と、ある国の元連盟幹部も述べる。

 

 編集部では、これらの主張が正しいかどうかを調べるため、ISUが採点異常検出システムについて公開している文書を元にそのアルゴリズムをコンピューターで再現した。結果の解釈にあたっては、前出のオランダ人ジャッジ、プリンス氏の助言や学術論文を参考にした。この方法論の草稿はISUにも送付したが、承認も訂正もされていない。TESについては全体の1%以下、PCSについてはさらに少ない率でしか逸脱が検出されないという結果が出た。

 

 ISUのシステムでは、今回の分析と異なり1度に一つの演技しか分析しない。そのため、特定の試合で1人のジャッジの採点が著しく逸脱していた場合はアルゴリズムに検知され、技術委員会はそれがミスだったのかバイアスだったのかを調査して決定する。だが、アルゴリズムは過去に遡ってパターンを追跡はしない。したがって、数々の試合で、場合によっては長年にわたって目立たない程度の自国上げを行ってきたジャッジはマークされないということになる。

 

 ISUのオンライン懲戒処分記録によると、ホームバイアスに関しては10年以上にわたって重い処分が行われていない。しかし、「批判書(letter of criticism)」や「査定書(assessment)」等が発行される軽微な処分に関しては、ISUは情報を公開していないのだ。

 

 Cyr氏は、このように評価を内部に留めておくというISUの決定を、企業による従業員の内部懲戒記録になぞらえる。だが、現役オフィシャルらの間には、透明性の向上がこのスポーツを改善するという声がある。ある元ISU幹部は「ISUがこれらのジャッジたちを公表すれば彼らも改めるはずだ」と話す。

 

 ISUは14/15年シーズン以後、「査定書」発行総数の公表さえ中止している。

 

 ISU内ではジャッジ評価の主要部分は二つの技術委員会が担う。それぞれ国際ジャッジ3名および選手、コーチ、議長各1名で構成され、ジャッジの資格停止勧告の他、新ルールの制定やシーズン毎のジャッジリストの決定を行うなど大きな権限を持つ。

 

 国際大会では常にレフェリーがジャッジ監督の一翼を担う。レフェリーはジャッジとは別個に各演技の採点を行い、技術委員会に対し特定ジャッジの詳しい調査を勧告することができる。

 

 世界選手権や五輪といったISUの重要競技会における監督プロセスはさらに念入りだ。判定役員評定委員会(OAC)の2人のオブザーバーが、ISUのアルゴリズムでマークされた逸脱採点のレビューを行う。その段階を経た後、技術委員会が該当ジャッジに対する批判書もしくは査定書の発行を勧告する。勧告にはスポーツダイレクターの承認が必要だ。評価書の発行が重なると、資格停止処分や降格処分が待っている。

 

 こういったジャッジ監査システムについて、競技会の質を守るための十分な働きをしているという意見もオフィシャルらからは聞かれた。ISUのCyr氏は「試合が終わった後も採点の詳細がじっくり調べられるていることをジャッジらは知っている」と言う。

 

 一方で反論もある。インタビュー中、複数のオフィシャルが、ISUから永久追求処分を受けたジャッジは1人も思い出せないと述べた。「しっかり取り締まっていない」とある元オフィシャルは言う。「すべてが茶番じみている」

 

 我々の分析によると、たった1人のジャッジが最終結果に影響を与えることができる。16年10月に行われたスケートアメリカ、男子シングルの試合を例に取ると、ロシア人ジャッジのマイラ・アバソヴァによる自国選手セルゲイ・ヴォロノフの採点は、1人を除き他のどのジャッジよりも高かった。アバソヴァの採点のおかげでヴォロノフは中国のボーヤン・ジンをわずか0.20点上回り総合4位に入った。アバソヴァがなぜそのような採点をしたのかは分からない。だが、彼女の点数を他のジャッジの出した点数の平均と入れ替えた場合、ヴォロノフは5位となりジンを下回る。

 

 アバソヴァに連絡を取ることはできなかったが、詳細な質問状をロシア連盟経由で送った。連盟の代表者はコメントを拒否、アバソヴァへのインタビューも許可されなかった。「彼女は手紙の存在を知っているが、コメントすることはない」

 

 元ISU幹部オフィシャルは、自国選手アゲは普通に行われていると説明する。「そうやってゲームに参加しなければ、置いてきぼりにされてしまう」

 

以上。

 

最後のロシア人ジャッジについての段落は、上下カットがあっても必ずしも万全ではないという例で挙げられているのかな。