数学のカリキュラムに「データ分析」が入ってから2回目の大学入試。去年に続いて 一橋大学 の入学試験でデータ分析の問題が出た。今回も選択問題として出されて「ベクトル」か「データ分析」のどちらかを選ぶ形だった。(去年の問題は こちら をどうぞ)
(一橋大 2016)
x は 0 以上の整数である。次の表は2つの科目 X と Y の試験を受けた5人の得点をまとめたものである。
① ② ③ ④ ⑤
科目 X の得点 x 6 4 7 4
科目 Y の得点 9 7 5 10 9
(1) 2n 個の実数 a1 , a2 , ... , an , b1 , b2 , ... , bn について、
a=1/nΣak , b=1/nΣbk とすると、
a=1/nΣak , b=1/nΣbk とすると、
Σ(ak-a)(bk-b)=Σakbk-nab
が成り立つことを示せ。 (※ Σak は「k が 1 から n まで変わるときの ak の和」を表す)
(2) 科目 X の得点と科目 Y の得点の相関係数 rXY を x で表せ。
(3) x の値を 2 増やして rXY を計算しても値は同じであった。
このとき、rXY の値を四捨五入して小数第1位まで求めよ。
《 解説・解答 》
(1) 左辺=Σ(ak-a)(bk-b)
=Σ(akbk-a・bk-b・ak+ab)
=Σakbk-aΣbk-bΣak+nab
=Σakbk-nab-nab+nab
=Σakbk-nab=右辺
(2) (1) の右辺の値を表をもとに計算すると、(9x+168)-5・(x+21)/5・8=x
一方、(1) の左辺を n で割ったものが共分散だから、X と Y の共分散 s(XY)=x/5
また、X の分散は (x^2+117)/5-{(x+21)/5}^2 だから、X の標準偏差 s(X)=√(4x^2-42x+144)/5
Y の分散は 16/5 だから、Y の標準偏差 s(Y)=4/√5
以上から、X と Y の相関係数は rXY= s(XY)/ s(X)・ s(Y)=√5・x/4√(4x^2-42x+144)
=√10/8・x/√(2x^2-21x+72) ・・・(A)
(3) X の値を 2 増やしたとき、また一から計算しなおすと、
X と Y の共分散は s(XY)=(x+2)/5
X の標準偏差は s(X)=√(4x^2-26x+76)/5
Y の標準偏差は(上と同じで) s(Y)=4/√5
X と Y の相関係数は rXY=√10/8・(x+2)/√(2x^2-13x+38) ・・・(B)
(A)=(B) を解いて、x=6
(A) または (B) に戻して、 rXY=√5/4≒0.559 ∴ 0.6
※ (2) と (3) の計算がわずらわしい。なかなか合わなかった。。。