花粉症で意識が朦朧としているのか、春だから朦朧としているのか区別がつかない個人事業主のa_koです。
さて、先日TOEICを受けて来ました。これに関しては…何も聞かないで下さい 

今日の話題は、私が最近ロイターやBloombergニュース並に目を通している経理マンさんのブログから思いついた、TOEICの満点についての、勉強上はどうでもいいお話です。
これを知っていてもTOEICの得点UPに全く役に立たないでしょう、笑

合コン(今って合コンじゃなくて街コンですか?)で「TOEICは1979年12月に第1回試験が開始されたんだよ~」と言ったら、確実にどん引きの憂き目に会うと思いますが、皆様ご存知ですか。TOEICってもう30年以上実施されているんですね。(1回リニュアールされてますし。)
TOEICテストの歴史
http://www.toeic.or.jp/philosophy/philosophy_01.html

さて、このTOEIC私が子供の頃は最先端なお洒落な試験でした。(ざっと、、20年から30年前です。当時は英検の方が一般的でしたよね?)
私は供の頃通っていた英会話スクールの先生は、かつては外資系企業で秘書をしていたという方で、トレンドに敏感なお洒落で素敵な先生でした。
その先生がTOEICの今思えばかなりハイスコア(正確には記憶にないので満点か満点近い)得点のスコアカードを教室に飾っていたのですが、、問題児(当時)の私が注目したのは、英検とは異なるこのテストにどれだけ価値があるかよりも、何でこのテストは100点を超えるテスト結果なのかでした。不思議だったので3桁の最初が9だったのは今でも覚えてます。(今考えるとすごいんだけど、そう言われても当時は英検1級が王様でした。)

心の優しい穏やかな先生を、困らせて、結果として超厳しい先生の同級生にI先生になったのは今ではいい思い出です・・・。
I先生は「英語を学ぶには文化を学ぶべし」と指導のもと、聖書から哲学書まで目を通された勉強家でいらしゃったのですが、私はその教えを実践すべく米英の刑事・探偵ドラマを見まくりました。 と言う事で、このお二人の影響で、私は早い段階からTOEICの不思議な得点付に興味を覚えていたわけです。

さて、この「990点満点」の仕様に関してはTOEICの公式ホームページにも載っていますが、「テスト結果は合格・不合格ではなく、リスニング5~495点、リーディング5~495点、トータル10~990点のスコアで5点刻みで表示されます。このスコアは正答数そのままの素点(Raw Score)ではなく、スコアの同一化(Equating)と呼ばれる統計処理によって算出された換算点(Scaled Score)です。」となっています。

テスト結果について

http://www.toeic.or.jp/toeic/about/score/#a

この採点方法に関しては、テストを作成しているETSが大変丁寧に解説してくれています。(英語を読まなくても図だけで多少は想像ができそうな気がしますが、いかがでしょうか?)
Why Do Standardized Testing Programs Report Scaled Scores?
Why Not Just Report the Raw or Percent-Correct Scores?
http://www.ets.org/Media/Research/pdf/RD_Connections16.pdf

ざっくり理解すると、これはTOEICは「いつ受けても同じレベルで実力が測れるようにしている」と言うコンセプトがあります。でも、やはり同じテストでもバージョンの違いが存在するので、Raw scoreでの結果をそのまま用いず、(これは20問正解したら、20点)、一旦 Equatingを行います。
Equating とは、「Process used to place all forms of the same test on the same scale and make scores comparable across forms」 と定義されています。
要するに、例えば第170回に受けても、第175回に受けても、受験生の実力を同等に測れるようにしようとしている…って事でしょう。
また、実施回によって(問題のEdition)によって、難易度が異なっていたとしても、この Equating によって素点が同じ20点でもスコアは異なることになります。従って難易度が高いものが同じ20点でもScaled scoreはハイスコアになります。(※かなり説明は省略しています。問題の難易度や問題の設定に関しては結構長々と説明されているので興味がある人は全文を…。)
TOEICを連続して受験していると、類似の論点の問題を見かけると思いますが、どうやらそれが
  各formにはAnchor Items と言う、バージョン縦断してスコア評価するための紐付けに使う問題があるんですね。そして、結果としてScaled scoreが集計されると…。 

ところで、このアンカーをうっかり間違えるとどうなるんでしょう…。ちょっと気になりつつ、
本日は以上です。
(最近調べると調べる度に新しい疑問が増える傾向にあります…。