『在フランス保健医療専門家ネットワークの会、東京例会』第一回の記念すべき講演は、この6月に東京大学大学院新領域創成科学研究科、メディカル情報生命専攻、複雑形質ゲノム解析分野の教授にご就任なさった鎌谷洋一郎先生がご登壇なさいました。
タイトルにもエスプリが効いてます。「les aventures génomiques d'un Japonais à Paris 〜ある日本男児のパリでゲノム的アバンチュール〜」
ご理解頂く助けに。まずはいくつかの“ゲノム業界用語”を少し噛み砕いてご説明いたします。
SNP(single nucleotide polymorphism:スニップ、一塩基多型)
ヒトが保有する約30億の塩基対(水素結合により特異的に結合したもの。アデニンとチミン、グアニンとシトシン)の配列には人種や個人間で異なる部分があり、1つの塩基だけが別の塩基に置き換わっているものをSNPといいます。SNPは集団に1%以上の頻度で存在するありふれたバリアントを意味し、個人ごとに見る場合はSNV(Single Nucleotide Variant)と呼ぶ方が正確です。
このSNVは、おそらく全ゲノムに一人当たり約350万カ所ほどあると考えられます。その中には体内で作られる酵素やタンパク質の量、発現の時期、機能などに違いを生み出すものがあり、それが体質の違いや、ある特定の病気へのかかりやすさ、薬剤の効きやすさや副作用の出方などの個人差を生み出す要因になっています。
GWAS(Genome Wide Association Study:ジーワス、ゲノムワイド関連解析)
数個の遺伝子の異常のみで説明の付く病気はわずかで、大半が複数の遺伝子に少しずつ影響されることで発症する多因子疾患です。よって狭い領域の解析に加えて、ゲノム全体を俯瞰できる方法として編み出されたのがGWASです。
要するにSNPの中から、全ゲノムのバリアントを代表する50〜100万か所の遺伝子型を決定し、主にSNPの頻度と、病気や量的形質との関連を高度な計算アルゴリズムを利用し統計的に調べる方法のことをいいます。
ジェノタイピング(遺伝子型決定・遺伝子型判定)
全ゲノムの配列を解読(シークエンジング)する代わりに、個人間で異なることがわかっているゲノム上の場所にフォーカスして検索する技術のことをいいます。
♠ご経歴♠︎
鎌谷先生は、東大医科研ヒトゲノム解析センターご勤務時代に、慢性B型肝炎のGWASと日本人の疫学的考察、日本人14700人の血算データを利用したGWASなどの研究をなさり、留学先には、ありがちなオックスフォードやハーバードではなく、あえてフランス・パリを選択なさりました。その動機の一つとは、「研究生活だけで人生を終わらせたくなかったから」!
ご留学先であるパリのCEPH(Centre d'Étude du Polymorphisme Humain)では、加齢黄斑変性症やアルツハイマー病のメタ解析、頸動脈解離のGWASの共同研究などを成し遂げられた後、ご帰国なさいました。
前回のご講演(→★) での感動を再び!
ゲノムデータの特徴をプロットすると、なんとそのままヨーロッパの国々の国境線がわかります。
ご帰国後は日本人16万人の第二回血算データのGWASや脳梗塞のGWASの共同研究など、数多くの成果を発表なさり、ゲノム医療業界を牽引なさっております。
★ゲノム解析のエッセンシャルとは?
30億塩基対あるヒトゲノムですが、99.5%はほぼ同じで、個体差というのは、0.5%の違いに現れます。ヒトゲノムに存在するSNPを一度に大量にジェノタイピングを行うことで、疾患や体質に影響を与える遺伝子の探索が可能になります。全ゲノム配列をシークエンサーで解読するには、だいぶ価格が下がった今でも一人につき10万円程度かかりますが、全ゲノムのジェノタイピングは今なら1万円を大きく下回ることもあります。逆に考えると、同じ予算でジェノタイピングをすると、全ゲノムシークエンスの10倍以上の人数のゲノムデータを取得できます(精密さよりも数で勝負、質より量!)。
遺伝子研究の標準手法は、昔も今もマウスの特定の遺伝子機能を潰す「ノックアウトマウス」の作成です。しかしマウスとヒトは完全に同じではなく、マウスで起きたことがヒトで起こる保証はありません。ところがノックアウトヒューマンの作成は倫理的にNGです。iPS細胞は、細胞レベルではヒトと同じものですが、完全な組織を備えたヒトそのものではありません。そこで、ヒト集団の“膨大なデータ”を統計学的に解析すること必須となります。
では膨大なデータとはどのくらいのスケール感でしょうか?10万?100万? こちらについては後編で述べます。
★ ゲノム解析とは、何を狙ったものでしょうか?
DNA→ RNA→ 蛋白質(ここまでセントラルドグマ)→ 代謝物質→病気
ゲノムから病気までは距離が長いのでノイズが多く入りますが、スタート地点なので、ゲノムの結果は手堅いし、ぶれません。よってゲノムの解析によって関係性が解明されます。
結果は病気の頻度によって違いがでます。
ゲノムが原因と言われる稀な疾患(厚労省定義:国内患者数5万人以下)の場合、典型的には、ゲノム上1.5%しかないタンパク質に翻訳される遺伝子部分に変異が見られます。この場合、DNAとの相関関係が強くでます。
DM(糖尿病)などのありふれた疾患や、身長、体重、性格、運動能力などの相関については、前記のゲノムのタンパク機能以外の部分にもたくさんシグナルがでて、数多くのファクター(多因子)がそれぞれ緩く絡み合っていることがわかります。
以前は、ヒトゲノムのうちRNAに転写されタンパク質へと翻訳される、1.5%ぐらいの領域以外のゲノム領域は、意味をなさないジャンクDNAであるとの主張がなされたこともありました。ところが現在では、シークエンス技術の発展により実に非翻訳領域の7割以上は機能がある(意味がある)ことが判明してきました。
GWASの結果、ありふれた疾患の関連バリアントの多くがそういった機能的な非翻訳領域に集積することがわかってきたのです。よってGWASをすることでヒトの非翻訳領域の謎に迫っていけるのではないかと考えられます。
★将来、肥満になるかどうかは遺伝子からわかるのでしょうか?
肥満症を日本人16万人のデータから解析すると、中枢神経系と免疫のB細胞に関わることが示唆されました。動脈硬化と炎症との関わりについて、ゲノム観点からでも追従されるという結果に。
ただし、将来肥満になるかどうかについては、ゲノム上に83箇所(日本人単独)ものバリアントがあり、予測できるにしても2.7%、との結果になりました。残り97.3%は予測不能な訳ですから、この答えの現時点での正解は、
→“将来肥満になるかどうかはまだ遺伝子だけでは全くわからない” です。今後の研究結果に期待します。
ちなみに最近アメリカで、“出生から成人までの体重と肥満の関連性に多遺伝子で予測する”という論文が発表されましたので、アメリカ人であれば、答えが違ってくるかもしれません。ここでなぜ、人種&地域限定でお話ししたかの答えは後編(→♠️) に!