(過去記事1)の続き.

 

遺伝率はどのような仮定の下で計算するかという話.

数学的な用語は(過去記事2)を参照してほしい.

 

(過去記事1)で書いたように,結論を先に言えば,

 

(身長の遺伝率)=2*((一卵性双生児の身長の相関係数)-(二卵性双生児の身長の相関係数)) (*3)

 

として,右辺を計算して左辺の値としているのである.その根拠を述べる.

 

(過去記事2)では,確率空間(S,p)上の確率変数Xが

X=A+B

と二つの独立な確率変数の和として書けると仮定した.

Aを先天的,Bを後天的と呼んだ.

今回は更に,

X=A+C+D (**1)

と3つの独立な確率変数の和として書けると仮定する.

Aを先天的,C+Dが後天的である.

気持ちとしてはAが受精卵の遺伝子で決まる特性,

Cは家庭環境で決まる特性,

Dはそれ以外で決まる特性である.

 これからは双子を考えるわけであるが,

双子でもDのインプットはまるで違う.

Cのインプットは一卵性,二卵性にかかわらず同性の双子なら同じと考える.

Aのインプットは一卵性なら全く同じ.二卵性なら遺伝子の”半分”は同じと考える.

”半分”の意味をこれから考えていきたい.

ヒトの染色体は23組46本ある.

46本のうち23本は父親から,もう23本は母親から得る.

23本の23組目で父からY染色体を得るか,X染色体を得るかで性別が決まる.

よって性別が決まれば,あとは45本の各染色体は,父からもらうか母からもらうかは属する組で決まっている.

問題は,父(母)からもらうなら,父(母)がもっている1組2本のうちのどちらを貰うかだ.

よって,同性の二卵性双生児がいた場合,45本の染色体のうち期待値として半数は同一でもう半数は異なる

と考えられる.

 

 身長,学力,収入,髪の毛の色など,考えている特性に応じて,どの染色体のどの遺伝情報が重要なのか,詳細には分かっていない.学力とか運動能力とか複雑な特性になると多くの遺伝情報が複雑に絡み合って決まるだろう.

しかしここでは単純化を行いたい.

それぞれの遺伝情報によって,それが特性に貢献する度合いが決まっていて,トータルとしての特性は,それらの度合の和になっているということだ.

つまりは,

確率空間SがS=S_1*...*S_k*T*Uと確率空間の直積(k+1次元ベクトルの集合)に書かれていて,

s=(s_1,...,s_k,t,u)∊Sに対するA(s)は

A(s)=A_1(s_1)+...+A_k(s_k)  (**2)

となる.そのような(互いに独立な)確率変数A_i:S_i ->R(実数全体集合)

が存在するという仮定である.

この性質を相加性とか相加的とか呼ぼう.

この仮定には積極的な根拠は無い.

A(s_1,...,s_k,t,u)=max {A_1(s_1), ..., A_k(s_k)}

とか別の形に書けるような確率変数Xの場合は駄目である.

 

身長,体重,学力テスト,年収,寿命など,Xがどの場合かでこの仮定が成立かどうかは分からない.

というか,まあ厳密には成り立たないだろう.

しかし,とりあえずこの単純化をするのである.この相加性の仮定は乱暴ではあるが,そのことを覚悟のうえで遺伝率は使わなければならない.

 

 

 (1)一卵性双生児の場合

一卵性双生児の場合,A+Cの値は全く同じ,Dはインプットが違うのでアウトプットである特性貢献度も異なると考える.

X(s_1,...,s_k,t,u)=A_1(s_1)+...+A_k(s_k)+C(t)+D(u).

(**1)は,(過去記事1)で議論したことより,

X, A, C, D, A_1, ..., A_k

は全て平均0と仮定してよい.

E[X]=E[A]=E[C]=E[D]=E[A_1]=...=E[A_k]=0 (**3)

 

よって一卵性双生児の相関係数は

Corr[A+C+Da, A+C+Db]

=(Var[A]+Var[C]+Var[Da,Db])/Var[X]

=(Var[A]+Var[C])/Var[X]  (**4)

上でDa, DbCaは本質的にDと同じだが選ばれる確率空間が異なるので区別している.

正確に言うと,確率空間

S=(S_1*...*S_k)*T*U

で考えるのではなく,

S':=(S_1*...*S_k)*T*U*U

で考えており,

Da(s_1,...,s_k,t,u,u')=D(u)

Db(s_1,...,s_k,t,u,u')=D(u')

である.

 

 

 (2)二卵性双生児の場合

二卵性双生児で同性なら家庭環境Cは一卵性双生児と変わらず同じとしよう.Dは異なる.

問題はAだが,

A_1,....,A_kのうち半分が同じで半分が違う.

簡単のためkを偶数と仮定して

S'':=(S_1*...*S_k)^2*{0,1}^(2k)*T*U*U

として,

各s=(s_1,s'_1,d_1,d'_1,...,s_k,s'_k,d_k,d'_k,t,u,u')と

各i(=1,...,k)に対し,

d_i=0 => Aa_i(s):=A_i(s_i)

d_i=1 => Aa_i(s):=A_i(s'_i)

d'_i=0 => Ab_i(s):=A_i(s_i)

d'_i=1 => Ab_i(s):=A_i(s'_i)

とする.

 各iに対し,確率1/2でAa_i(s)=Ab_i(s)となる.

 

よって,二卵性双生児の相関係数は
Corr[Aa+C+Da,Ab+C+Db]
=Cov[Aa+C+Da,Ab+C+Db]/Var[X]
=(Cov[Aa,Ab]+Var[C])/Var[X] (**5)
 
Ab_i(s)は確率1/2でAa_i(s)と等しくなり,確率1/2でAa_i(s)とは独立になる.なぜなら,A_i(s_i)とA_i(s'_i)は(s_i,s'_iが独立に取られるから)独立だからである.
よって

Cov[Aa,Ab]=Cov[Aa,0.5Aa]=0.5Cov[Aa,Aa]=0.5Cov[A,A]=0.5Var[A]

となり,

(**5)は

Corr[Aa+C+Da,Ab+C+Db]=(0.5Var[A]+Var[C])/Var[X] (**6)

と考える.

(3)一卵性双生児と二卵性双生児: (*3)の証明終り

よって2*((**4)ー(**6))を考えると

Var[A]/Var[X]

 
となる.これが遺伝率の定義であった.
これで(*3)が説明されたことになる.
 
 次回は最終回.まとめと感想.
続き
 

(過去記事1)

 

 

(過去記事2)