今年も一橋大で「データ分析」出題 | 感じる科学、味わう数学

感じる科学、味わう数学

科学は、自然そのものというより、モデルです。数学は、関係性を捉える枠組みです。
だから、正しいか否かより、大事なのは視点です。

 数学のカリキュラムに「データ分析」が入ってから2回目の大学入試。去年に続いて 一橋大学 の入学試験でデータ分析の問題が出た。今回も選択問題として出されて「ベクトル」か「データ分析」のどちらかを選ぶ形だった。(去年の問題は こちら をどうぞ)


(一橋大 2016)

 x は 0 以上の整数である。次の表は2つの科目 X と Y の試験を受けた5人の得点をまとめたものである。

             ①  ②  ③  ④  ⑤
     科目 X の得点  x   6   4   7   4
     科目 Y の得点  9   7   5  10  9

(1) 2n 個の実数 a1 , a2 , ... , an , b1 , b2 , ... , bn について、
   a=1/nΣak
b=1/nΣbk とすると、
        Σ(ak-a)(bk-b)=Σakbk-nab
   が成り立つことを示せ。  (※ Σak は「k が 1 から n まで変わるときの ak の和」を表す)

(2) 科目 X の得点と科目 Y の得点の相関係数 rXY を x で表せ。

(3) x の値を 2 増やして rXY を計算しても値は同じであった。
   このとき、rXY の値を四捨五入して小数第1位まで求めよ。



《 解説・解答 》
(1) 左辺=Σ(ak-a)(bk-b)
      =Σ(akbka・bkb・ak+ab)
      =Σakbk-aΣbk-bΣak+nab
      =Σakbk-nab-nab+nab
      =Σakbk-nab=右辺

(2) (1) の右辺の値を表をもとに計算すると、(9x+168)-5・(x+21)/5・8=x
   一方、(1) の左辺を n で割ったものが共分散だから、X と Y の共分散 s(XY)=x/5
   また、X の分散は (x^2+117)/5-{(x+21)/5}^2 だから、X の標準偏差 s(X)=√(4x^2-42x+144)/5
      Y の分散は 16/5 だから、Y の標準偏差 s(Y)=4/√5
   以上から、X と Y の相関係数は rXY s(XY) s(X) s(Y)=√5・x/4√(4x^2-42x+144)
                         =√10/8・x√(2x^2-21x+72) ・・・(A)

(3) X の値を 2 増やしたとき、また一から計算しなおすと、
   X と Y の共分散は s(XY)=(x+2)/5
   X の標準偏差は s(X)=√(4x^2-26x+76)/5
   Y の標準偏差は(上と同じで) s(Y)=4/√5
   X と Y の相関係数は rXY√10/8・(x+2)√(2x^2-13x+38) ・・・(B)
   (A)=(B) を解いて、x=6
   (A) または (B) に戻して、 rXY√5/4≒0.559   ∴  0.6  

※ (2) と (3) の計算がわずらわしい。なかなか合わなかった。。。