有病率が低い場合、ケースコントロール研究でオッズ比≒相対危険度とは

先の記事で、筆者はこの「ケースコントロール研究でオッズ比≒相対危険度」の言葉の意味がよく分からなかったので、統計の本を引っ張り出して勉強してみました¹⁾²⁾³⁾。統計に詳しい方には教科書的な話なので、読み飛ばして頂いて結構です。統計に詳しくない方には、ちょっとした勉強になると思います。とりあえず用語の解説から入ります。

相対危険度：リスク比とも呼ばれます。疫学の教科書的には「暴露群と非暴露群における疾病の頻度(有病率)を確率(%)で表したもの」です。通常は前向きのコホート研究で導き出されます。先の記事の図1で言えばプラセボ群の有病率は162/21728≒0.75%、ワクチン接種群の有病率8/21720≒0.037%です。ワクチン接種によって相対危険度は0.037÷0.75=0.05(5%)まで低下するので、ワクチンの有効率は100-5=95%となります。　

このように、前向きコホートでは暴露群と非暴露群を疾病がない時から一定期間全て追跡するので、それぞれ有病率がデータとして出て来ます。それを比べることによって相対危険度が計算できます。しかしケースコントロール研究では、まず疾患群(ケース)を抽出し、それに対するコントロールを設定するので有病率は分かりません(コントロールは疾病のない人のごく一部だから当然です)。代わりにケースコントロール研究ではオッズやオッズ比を算出します。

オッズ：賭け事でよく使う言葉です。確率の概念が登場するまでは、ギャンブラーは勝敗のものさしとしてオッズをよく使用していたようです。賭け事でのオッズの定義は「勝敗の比(勝ち/負け)」です。ワクチン研究なら接種/未接種の比です。オッズは比なので%のような単位はありません。

オッズと確率の関係：賭け事の場合、勝つ確率は「勝った回数/勝負の総数」で表されます。この確率をpとすると、負ける確率は「負けた回数/勝負の総数」ですが、全体の確率から勝ちの確率を引いたものでもあるので、勝ちの確率pを使って負けの確率を表すと1-pとなります。したがって、勝ちのオッズは勝ち/負けの比なので、p/(1-p)と表すことも出来ます。

オッズ比：文字通りオッズとオッズの比です。オッズ比も比なので単位はありません。オッズ比を出す場合、何かのオッズを分母(基準)にして別のオッズを分子にして割り算します。基準にしたオッズをreferenceといいます。このようにオッズ比は何かのオッズが基準より大きいか、小さいかを判断する指標になります。例えば先の記事の図2なら、陽性者の接種のオッズ/陰性者の接種のオッズ＝0.18なので、ワクチン接種した人の陽性が少ないと言えそうです。ただしオッズもオッズ比も確率ではなく比なので、「接種した人の陽性率が0.18=18%になる」とは通常では言えません。ただし後述する条件を満たす場合は言えることがあります。

「有病率が分からないケースコントロール研究では相対危険度は分からないではないか」と、普通はそう思いますが、頭のいい人がうまい方法を考えてくれたので大丈夫です。冒頭にある通り、有病率が低い場合、ケースコントロール研究のオッズ比はコホート研究の相対危険度と近似出来るのです。ちなみにこの関係を初めて明らかにしたのはロジスティック回帰分析を提唱したCornfieldだったとのことです⁴⁾。

　なぜそうなるのかを以下に示します。学生時代に確率統計で追試を食らった筆者には少々キツい内容でしたが、何とか理解できました。落第点の筆者でも何とか分かりましたので、少し(中学レベルの)数式が出てきますが大丈夫です。

　最初にコホート研究で得られるデータを提示します。コロナの感染あり、なしとワクチン接種あり、なしでデータは以下の表にまとめられます。

この場合はコホート研究なので有病率と相対危険度が計算できます。

　ワクチン接種ありの有病率はa/(a+b)

　ワクチン接種なしの有病率はc/(c+d)

ワクチン接種ありの相対危険度はa/(a+b)÷c/(c+d)=a(c+d)/c(a+b)

となります。

　次にケースコントロール研究で得られるデータです。ケースコントロール研究では、まず起こった疾患(ケース)を抽出して、疾患なしの人から「バイアスがないよう適切に」コントロールを抽出します²⁾。

　全体像が分かりやすいように、データを上記のコホート研究の集団から得るとします。コホート研究は現実の縮図なので、現実から得られるデータと同じと考えて差し支えないはずです。

　ケースコントロール研究ではまず起こった疾患を抽出するので、コロナ感染ありのaとcのデータ(もしくはその縮小した相似のデータ)が得られるはずです。縮小した割合をα(0<α≦1)とすると、α・aとα・cの数値が得られます。

　続いてコロナ感染なしのコントロールのデータですが、ケースコントロール研究では疾患なしの人がどれだけ居るのかは分かりません。疾患なしの人からデータを「バイアスなく適切に」抽出することがケースコントロール研究で難しい所です。仮に適切なコントロールが得られたとすると、そのデータはケースの場合と同様に、bとdの比率はそのままに、何分の1かに縮小した数になっているはずです⁵⁾。何分の1かの数値を今回βと仮定すると、コントロールの数値はβ・bとβ・d(0<β≦1)となるはずです。ケースコントロール研究ではβ・bとβ・dの数値は、α・aとα・cと同じぐらいの数値か、2倍、3倍程度にすることが多いので、βはかなり小さめの数値になるはずです。

　コホート研究の時とは違って、このα・a+β・bやα・b+β・dという数値には意味がありません。αやβがどんな数値になっているのかは神様しか分からないからです。ケースコントロール研究では有病率が分からないのは、数学的にはこういう理由からです。

　代わりにケースコントロール研究ではオッズやオッズ比を取ります。

コロナ感染ありの人のワクチン接種のオッズはα・a/ α・c=a/c、

コロナ感染なしの人のワクチン接種のオッズはβ・b/β・d=b/dとなります。

したがって、コロナ感染なしをrefereceとしたオッズ比はa/c÷b/d=ad/bcとなります。オッズやオッズ比を取るとαとかβは取れて、すっきりした数値になっていることが分かると思います。　　

　後ろ向きのケースコントロール研究では、データにαやβといった神様しか分からない係数が入り込んで来るので、そのままではケースとコントロールを比較することが出来ません(コホートでは可能)。オッズやオッズ比を取るとαやβが取れてケースとコントロールを比較出来るということです。

　ところで話は戻りますが、先のコホート研究で得られた相対危険度はa(c+d)/c(a+b)でした。もしも有病率が低い場合、コロナ感染なしの人が非常に多いので、bとdの数値が非常に大きくなります(ファイザーのmRNAワクチンの研究で言えばワクチン接種者の患者が8人、非感染者が2万人以上)。

この時、cとaの数値はbやdに比べると無視出来るほど小さいので、

相対危険度＝a(c+d)/c(a+b)≒ad/bc

と近似できます。

　ad/bcは見覚えのある形だと思います。そうです、ケースコントロール研究で求めたオッズ比と同じ形です。

　このように有病率が低い(bやdが大きい)場合、ケースコントロール研究のオッズ比はコホート研究の相対危険度と近似できます。「有病率が低い」とはどのぐらいの数値か、特に決まりはないようですが、教科書的には10%以下、数%なら問題ないようです⁵⁾。10%を超えると誤差が大きくなるのでこの関係は使えなくなります。　

参考文献

1)いまさら誰にも聞けない医学統計の基礎のキソ2 　浅井隆著　アトムス

2)みんなの医療統計 12日間で基礎理論とEZRを完全マスター　新谷歩著　講談社

3)論文を正しく読み解くためのやさしい統計学　中村好一編　診断と治療社

4)Cornfield J. A method of estimating comparative rates from clinical data application to cancer of the lung,breast and cervix.

J Natl Cancer Inst 1951；11：1269-75.

5)https://www.jstage.jst.go.jp/article/jjpe/25/2/25_25.56/_pdf/-char/ja