乳がん術後化学療法の真の実力とは？

乳がん術後化学療法の真の実力とは？

前回のブログ記事で取り上げたアピタルがん夜間学校「抗がん剤は効くの、効かないの？」の「授業」が同サイトに動画でアップされています。視聴しましたが、アピタル編集部に送った私のメールは予想どおり「授業」では取り上げられませんでした。
同編集部では事前に抗がん剤治療に関して広く質問や疑問を募集しており、授業時間枠で紹介するには収まり切らない多数のメールや手紙、ファックス等が寄せられたと言っていたので、私の疑問や質問が取り上げられなかったことをとやかく言うつもりはありません。
ただ「授業」を視聴して、不思議に感じるとともに不審感を覚えた点があります。それは、勝俣氏が「がんの再発・転移を予防するための抗がん剤治療」を抗がん剤治療の主要な目的のひとつであると掲げていながら、患者にとってその「治療」がどのような、どれくらいのメリットがあるのか、何も具体的に触れていなかったことです。
「再発・転移予防のための抗がん剤治療」いわゆる「術後化学療法」は、乳がんをはじめ消化器系がんや婦人科系がんなど多くのがん種で広く大勢の患者に行われ、全抗がん剤の中では処方患者数、量ともに大きな割合を占めています。抗がん剤製薬メーカにとって「術後化学療法」は、まさに売り上げの大きな部分を占める「ドル箱」分野とも言えます。
それだけ抗がん剤が広く大量に使われている「術後化学療法」なのですから、「授業」で取り上げて「術後化学療法」の具体的な解説があってしかるべきではないかと思いました。実際、勝俣氏は自著『「抗がん剤は効かない」の罪』や『医療否定本の嘘』の中では、「術後化学療法」の有効性と必要性を具体的な数字を挙げて繰り返し強調していたのですから。このギャップには違和感が残りました。

氏が自著の中で説いている「乳がん術後化学療法」の効果(延命や治癒)の統計推定値が誇大で欺瞞的なものであることは、『医療否定本の嘘』に対する私のAmazonレビューやそのコメント欄の【レビューの補足(その1)】等で解説、指摘しました。その要点は以下の通りです。

① 『医療否定本の嘘』に書かれている「毎年1950人もの乳がん患者さんが抗がん剤によって命が助かる計算になります。」は、乳がん患者や読者を大きくミスリードする誤った誇大宣伝である。

② 「乳がん術後補助化学療法」を受けている患者の9割以上が抗がん剤の恩恵を何ら受けることなく、副作用や後遺症のリスクだけに晒されていると推定できる。このような化学療法のデメリットについて、腫瘍内科医をはじめ多くのがん治療医が患者に的確で十分なインフォームを行っていない。

「抗がん剤は効くの、効かないの？」と題した勝俣氏の「授業」の全体的な流れや内容について言えば、いかにも抗がん剤治療を推進し指導する立場にある腫瘍内科医らしい、都合良く定式化された牽強付会なものだったというのが私の感想です。
「授業」の個々の内容については疑義や異論が少なからずありますが、今回は、勝俣氏の専門臨床領域でもある「乳がん術後化学療法」の効果について、その「エビデンス」とされるRCT比較試験に焦点を当てて検討をしてみたいと思います。

世界中のオンコロジスト(化学療法医/腫瘍内科医)やがん治療医によって、「乳がん術後化学療法」の効果(延命や治癒効果)は、確固たる「エビデンス」によって証明されたものであると強く主張されています。
例えば、勝俣氏は著書『「抗がん剤は効かない」の罪』(P15～P17)や『医療否定本の嘘』(P96)の中で論文[*1](N Engl J Med 1995, 332:901-6)(リンク先で論文のfull text を閲覧出来ます)を引用し、「再発を予防して、がんを治す効果が高まったことが、紛れもない事実として報告されています。」などと誇らかに強調していました。
たしかに、この論文[*1]で報告されているRCT比較試験(randomized controled trial : 無作為化比較試験)は、フォローアップ期間が20年と非常に長い試験であり、他の論文でも頻繁に引用され、腫瘍内科医やがん治療医の間では「乳がん術後化学療法」の「エビデンス」を示す枢要な論文だとされています。

そこでまずは、この論文に示されている無再発生存率グラフ(Relapse- free Survival : Figure1 Panel A )と全生存率グラフ(Overall Survival : Fiure1 Panel B)を以下に掲示します。

Figure 1. Relapse-free Survival (Panel A) and Overall Survival (Panel B) According to Treatment Group.With respect to relapse-free survival, 48 4of 179 patients in the control group were disease-free at 20 years, as compared with 74 of 207 patients in the CMF group. With respect to overall survival, 44 of 179 patients in the control group were alive at 20 years, as compared with 70 of 207 patients in the CMF group

【このRCT比較臨床試験と論文に対する批判的考察】

① RCT試験の肝要なポイントである試験登録患者の「無作為化割り付け」は適正に行わていたのか？？

このRCT比較試験では、最終的に386人の乳がん患者（被験者）が化学療法群と非化学療法群の2群に無作為に振り分けられています。この「無作為化割り付け」が公正かつ適切に行われていれば、両群の被験者の数はほぼ同数に近くなるはずです。ところが論文では207人(化学療法群)と179人(非化学療法群)になっており、偏りが大き過ぎるのではないかと思いました。これは論文を読んでまず最初に感じた疑問です。
もし、RCT試験の肝心なポイントである「無作為化割り付け」において、そこに何らかのバイアスや人為的な操作・介入が少しでも入ったりすると、結果(この試験の場合は生存率など)が簡単に左右され、試験全体の科学的信頼性が決定的とも言えるほど大きく損なわれることになるからです。

抗がん剤の効果を確かめる比較試験の殆んどは、せいぜい10～20％程度の統計的な有意差を見極めようとするものですから、最初の肝要な手順である「無作為化割り付け」が的確かつ厳正に行われることは極めて重要です。
もし、試験開始時点から両群の被験者たちの臨床的背景に何らかの偏りが存在し、例えば非化学療法群に乳がん以外の余病を持った被験者や長期的な生命予後が比較的悪い被験者(例えば、心、肺、肝、腎等の重要臓器に器質的障害や機能的障害がある患者)が10人程度多く紛れ込んだりすれば、10年～20年生存率の5％～10％程度の有意差は容易に生じてしまうからです。

そこで、この臨床試験でみられた両群間の被験者数の偏りがたまたまの偶然と言えるのか、言い換えれば、この比較試験において被験者の「無作為化割り付け」が適切かつ公正に行われていたのかどうかを検討してみたいと考え、確率統計学的な観点から検定をしてみました。
有意水準：5％で検定してみると、両群間の被験者数の偏り(207人と179人)は偶然とは言えない有意なものであるとの結果が出ました。
分かりやすく言うと、試験に登録された386人の患者（被験者）をコイントスをするようにそれぞれ2分の1の確率で2群(化学療法群と非化学療法群)にランダムに振り分けていくと、最終的に両群はそれぞれ193人前後に近い人数になるはずなのに、207人と179人という被験者数の偏りが生じるのは95％の確率で偶然とは言えないとなります。
つまり、このRCT比較臨床試験では、登録された386名の患者が化学療法群と非化学療法群の二群に適切に「無作為振り分け」がなされていたのかという点において、強い疑問が合理的に生じるのです。

もちろん、統計はあくまでも確率論なので「被験者の無作為化割り付けにおいて偏りが生じたのは、たまたまの偶然とは言えない」ということを100％の確率で断定することも出来ません。言い換えれば、5％の確率でそのような偏りも偶然に起こり得ることを示しています。

しかしそれを言うならば、論文の著者や腫瘍内科医らの「化学療法群と非化学療法群の生存率には統計学的な検定によって有意差があるとの結果が出た、したがってそれが化学療法の延命効果のエビデンスになる」という主張に対しても、それは偶然の偏りではないかとの反論が返って来ることになります。

上に掲示した全生存率グラフ(右側のOverall Survival (Panel B) )での化学療法群の20年生存率(34％)が非化学療法群のそれ(25％)よりも“有意に高い”といえるのは、グラフ内に示されているように有意確率p=0.03～0.04程度の話なので、「無作為化割り付け」には有意な偏りがあると検定した有意水準と同レベルの議論になります。

このRCT臨床試験の結果を報告した論文[*1]の記述(Methods)によれば、登録被験者の「無作為化割り付け」の前に以下の三項目の臨床的背景因子の層別化が行われていました。

(1) 年齢による層別化 : 49歳以下と50～75歳に二層化

(2) リンパ節転移の個数による層別化 : 1～4個と4個以上に二層化

(3) 乳房切除術のタイプによる層別化 : 定型乳房切除か拡大乳房切除か

また、論文では両群(Control GroupとCMF Group)における臨床的な背景諸因子による試験後のサブグループ分けとその解析が表(Table 1)で示されています。それを以下に転載します。

「Table 1」の左側に示されている、例えばPremenopausal(閉経前)とPostmenopausal(閉経後)患者の両群(Control GroupとCMF Group)における比率はそれぞれ48％対52％および50％対50％となっていますが、これらの比率は「無作為割り付け」前の層別化によるものではなく、試験後のサブグループ解析によって得られた数値です。Tumor size(腫瘍径が2cm未満かそれ以上か)についても同様です。
最初の「無作為化割り付け」時の両群の被験者数の間には上述したような統計学的に有意な偏りがあったにもかかわらず、試験後に行われたサブグループ解析における各サブグループの被験者数が、サンプル数が少ないにもかかわらず、数をピタリと揃えたように均等に両群（化学療法群と非化学療法群）に振り分けられた形になっている点も逆に、この試験は適正に遂行されていたのかという疑問を増幅させていると言えるでしょう。

他のがん種でもそうですが、術後化学療法と無治療(非化学療法)とを比較したRCT試験は僅かしか行われていません。なぜなら、1～2回のRCT試験で化学療法の効果に「統計学的な有意差」が僅かでも出ると、腫瘍内科医たちは「効果のエビデンスが出た治療において、無治療群を設定したRCT臨床試験を計画するのは倫理的に許されない」としてきたからです。
しかし、乳がん術後化学療法の効果を示した枢要な「エビデンス」とされているRCT比較臨床試験自体に上述したような大きな疑問、疑義があるので、試験結果で示された延命効果はとても額面通りには受け取れない、その科学的信頼性は極めて脆弱なものだと言わなければならないでしょう。

臨床比較試験ではサブグループの事後解析によってアウトカム(無再発生存率や全生存率など)の"有意な差"を無理矢理引っ張り出そうとする論文がままあります。この試験の論文の中にも、一例として、リンパ節転移が10個以上のサブグループの事後解析を行って、非化学療法群の20年生存率が0％であるのに対して化学療法(CMF療法)群のそれは17％であると化学療法の効果を強調するような記述があります。
17％といっても実数の話で言えば、化学療法群の被験者207人中に10個以上のリンパ節転移があった患者が18人であり、その内の3人が20年後に生存していたということであり、一方の非化学療法群のその実数は9人で20年後には1人も生存していなかったということなのです。また、「10個以上とそれ以下」というグループ分けにおいては、両グループそれぞれの個数の分散は検討されていませんし、データの提示もありません。
そのような内容、条件のもとで化学療法の効果を印象付けるような記述は統計学的に妥当とは言えないでしょう。実際、両者それぞれの比率である3/18(17％)と0/9(0％)を有意水準：5％で検定すれば「有意差なし」となります。

このように、試験の事後にサブグループ分けをしてサンプル数が少なくなった状態で、あれこれと色々な解析を加えることについては問題点も多く、医療統計学や統計疫学の専門家からも批判が上がっています。
「サブグループ事後解析」で指摘されている問題点は、ざっと以下のようなものになるでしょう。

[1] サブグループの事後解析では、サンプル数が少なくなることで統計的エラーが生じ易すい。

[2] 試験で事前に計画・デザインされていない「事後のサブグループ分け解析」では、どのようなサブグループ分けをするかという点で恣意的な選択が働きやすい。

[3] 年齢やリンパ節転移個数のような連続変数では、そのサブグループを分ける際の線引きがどこで行われるかによって結果が変わることがあり、またその線引きが恣意的に行われて真実性が歪められることも少なくない。

[4] サブグループの「平均値」が同じ場合であっても、その分散によっては結果が変わることもある。

次に付言したいのは、この論文[*1]自体は1995年に発表されたものですが、実は比較試験の登録被検者の「無作為化割り付け」が行われたのは1973年～1975年と40年も前の古い時代だということです。
この論文[*1]を『「抗がん剤は効かない」の罪』で引用した勝俣氏は、同じく同書で次のようにも書いています。

「当時の臨床試験のクオリティーの低さを世界中が反省して、96年、「日米欧医薬品規制調和国際会議(ICH)」という会議が開かれました。医薬品の臨床試験の実施方法やルールを標準化しようというこの会議で制定されたのが「ICH-GCP」(Good Clinical Practice)です。」(P53)

つまり、前後の文脈から勝俣氏が述べている主旨は、「1996年以前、1990年にかけてまでは臨床試験の質は非常に低いものでした。」と解釈できます。(その論旨自体には私も特に異論はありません)
このような時代背景からも、40年も前に開始されたこの比較試験が「クオリティー」の高いものであったのかは、疑問が残ると言わざるを得ません。当該臨床試験はイタリアミラノの医療機関で実施されたものですが、論文では、その医療機関の「倫理委員会」に試験デザインとプロトコルが申請され承認を受けたものであるとの記述があるだけです。
試験出発点の肝心な「無作為割り付け」作業に、もし何らかの問題や欠陥をかかえていたなら、たとえフォローアップ(追跡調査)が20年に渡って行われたとしても、その結果の科学的信憑性には、ずっと大きな疑問符が付きまといます。

この試験以後、統計的に妥当な登録被検者数で無治療と化学療法を比較したまともなRCT比較試験はほとんど行われていません。それでもがん治療医らは、「乳がん術後化学療法の延命効果は既に確固としたエビデンスで証明されているので、今更無治療との比較試験を計画するのは倫理的にも問題がある」としています。しかし、この言辞には多分にご都合主義的な面があります。何故なら、例えば子宮頸がん検診(細胞診)の有効性(死亡率低下)は確固としたエビデンスが確立していると言っているにもかかわらず、非検診群との比較試験が最近行われているからです。(インドでの大規模RCT比較試験)
10万人以上の女性が参加したこの大規模試験には多大な費用が投入されているはずです。検診の効果は証明されていると言ってきたのに、なぜ非検診群が設定されたのでしょうか。多大なコストと医療資源を投入するのなら、全員に検診を実施するのが彼らが言ってきた「倫理」に合致するのではないでしょうか。うがった見方をすれば、先進国ではないインドのそれも群部での試験だから、非検診群をおくことは倫理的に問題にはされないとでも考えたのでしょうか。
(ちなみに、インドで行われたこの大規模試験について、科学的な視点から検討を試みたWeb記事としては、『地域医療日誌:子宮頸がん検診には効果がありますか？』が参考になります)

乳がん術後化学療法の真の実力とは？(2)に続く.....。

************************************
【文献】
[*1] Adjuvant Cyclophosphamide, Methotrexate, and Fluorouracil in Node-Positive Breast Cancer — The Results of 20 Years of Follow-up. N Engl J Med 1995, 332:901-6
************************************

NANAのブログ

ﾌﾞﾛｸﾞの説明を入力します。

乳がん術後化学療法の真の実力とは？