略語
CR (complete response):完全奏功 PR (partial response):部分奏功 PD (progressive disease):進行 SD (stable disease):安定 |
臨床医学
個々の治療経験に基づくanecdotal(逸話的な)報告
↓
昔のカルテから引き出したデータなど:cherry-picking(良いことだけ選ぶ)
↓
正しい方法論に則ったEBM
様々なルールがあるが、
Ⅰ:安全性
Ⅱ:有効性
ーーーーー→がん・AIDSなど認可
Ⅲ:標準治療との比較
ーーーーーーーーーー→認可(その他)
Ⅳ:毒性
PhaseⅠ:癌とそれ以外は異なる
↓ 有効性が認められたら
PhaseⅡ
- NCI-CTCによるToxicity
- エンドポイント
- 効果判定
- サンプルサイズ
1. PhaseⅠでも毒性を評価しているが、施設が増えるためもう一度Toxicityの評価
PhaseⅡ:50~100例(cf. PhaseⅠ:15例)
2. 固形癌→腫瘍縮小効果:どれくらい?→response rate
胃・卵巣癌の腹水など標的病変が明らかでないとき
OS rate
PFS rate
RR(奏功率)を評価するには標的病変を経時的にフォロー
RECIST基準(固形癌)
VICC, WHO:画像上の長径×短径
ややこしいので一次元(一番長い所)だけで評価=RECIST
※測定可能病変:20 mm以上、ヘリカルCT 5 mm以上
WHO:積の和 RECIST:最長径の和 RECIST1.0:1臓器5個まで合計10個 RECIST1.1:1臓器2個まで合計5個 |
リンパ節は短径15 mm以上で標的臓器←リンパ節は標的臓器として分かりにくい
↓ RECISTが適用しにくい
・PETによる壊死の描出:PERCIST
・癌に対する免疫療法:irRC
・PERCIST
治療しても小さくならないが、奏功している(= PETでは病変が小さくなっている)
・irRC
免疫療法には時間がかかるので、
- 腫瘍縮小
- 長期間持続したstable disease
- 一旦腫瘍が増大した後のresponse
- 新病変を伴う←RECISTではこの時点でPDになる
WHO基準(縦径×横径=面積)で出さなくても一次元で同様に評価可能
近年のresponse評価 ・RECIST1.1 ・PERCIST ・irRC |
最良総合評価
CR 4週以上
CT 1ヶ月ごと |
1月 |
2月 |
3月 |
4月 |
5月 |
腫瘍径 |
10 |
7 |
5 |
5 |
6 |
CT |
〇 |
〇 |
〇 |
〇 |
〇 |
|
治療前 |
PRin |
PR確定 |
PR |
PD |
※PRin:ベースライン径に比べて標的病変の径和が30%以上減少
評価:PR→PD
最良総合評価:PR
CT 2ヶ月おき |
1月 |
2月 |
3月 |
4月 |
5月 |
腫瘍径 |
10 |
- |
5 |
- |
6 |
CT |
〇 |
× |
〇 |
× |
〇 |
|
治療前 |
|
PRin |
|
PD |
評価:SD→PD
最良総合評価:SD
【PhaseⅡ】
安全性でなく、奏功率がメイン
CR, PR症例の数がどれくらい(分子としてのCR+PRが多い方が良い)
サンプルサイズ
SWOGのStatistical Tools
・αエラー:0.05
・閾値生存率
・期待生存率
・βエラー:0.2
閾値生存率と期待生存率の値を変えることでサンプルサイズを恣意的にみることができてしまう
MSTを使う方法もあり
閾値PFS
期待PFS
PhaseⅢがメインだが、PhaseⅡでも予後を確認
PhaseⅡ研究の結果だけでOKの場合もある
:奏功率ではなく、予後に関して明らかに有意差があるデータ
・急性前骨髄性白血病に対するATRA
・慢性骨髄性白血病とGISTに対するImatinib
誰がどう見ても予後やそれに関連したQOLに極めて大きな差がある新治療=続行は倫理的に問題
しかし、実際には小さな差しか出ない場合が多い
↓ PhaseⅡで有効性が示唆されたら
【PhaseⅢ】
ポイント 1. Randomization 2. Sample size 3. Intention to treat:解析におけるルールの遵守 |
1. バイアスを避ける
背景の偏り、都合の良い結果解釈、暴露バイアスなど
例.
1936年アメリカ大統領選挙
調査機関 |
調査人数 |
ルーズベルト |
ランドン |
ダイジェスト |
238万人 |
43% |
57% |
ギャラップ |
3000人 |
54% |
46% |
↓ 選挙
ルーズベルト:60.2%
ランドン:39.8%
ダイジェストは自動車(共和党支持者の多い白人の中流階級が主)の顧客名簿をもとにした一方、ギャラップは無作為
2. サンプルサイズ←PhaseⅡでのサンプルサイズと異なる
生物統計学的に意味のあるものとするため
①αエラー:あわてものの早合点
②βエラー:うっかりものの見過ごし
β = 0.2できれば0.1
③予想される生存率の差
④症例集計期間
例. 5年生存率が60~80%の治癒切除後の消化器癌に対する治療
αエラー:0.05
βエラー:0.2
集積期間:2年
平均追跡期間:6年
コントロール群の5年生存率を70%、新治療群の5年生存率を75%(Risk Reduction:20%、生存率改善:5%)とすると必要な症例数は882例である
必要症例数を集積できる見込みのないPhaseⅢ研究を企画することは資金やマンパワーの無駄である
→必要症例数に達しない場合は、小規模なPhaseⅢ、メタアナリシスも考慮できる
3. Intention to Treat
除外・脱落は×
最近では少し融通がきくようになった
PPS (Per Protocol Set)
FAS (Full Analysis Set)
ただしどの方法を用いてもITTの結果は必ず報告
【実臨床へのimplication】
少しの生存率の上昇が患者個人に有用であるのか
生存率の差 |
治療を希望する患者の割合 |
1% |
50% |
3% |
62% |
5% |
73% |
→1%上がるだけでも治療を受けたいと思う患者が半数以上
不正
fabrication:データ、結果の偽造
falsification:データ、結果の改ざん
plagiarism:他の研究者のアイデアの剽窃
不正の3大要因
施設要因
臨床医学研究自身が内包する構造的な問題
個人要因
生物統計
詳細にprespecifyしておかない限り、どのような結果でも作り出せる
・途中で経過を絶えず覗いて差のついた時点で結果を出す
・都合の悪い症例をineligibleとして除外して解析
・非劣性試験においてサンプル設計
↓
Central Statistical Monitoring (CSM):データの質と整合性の担保
他の施設との間で患者集団、データ収集に差はないかみる
ref.
総論:https://www.jstage.jst.go.jp/article/arerugi/53/4/53_KJ00000818882/_pdf
PERCIST:http://jnm.snmjournals.org/content/50/Suppl_1/122S.full
irRC:https://academic.oup.com/jnci/article/100/18/1280/2607204
CSM:https://link.springer.com/content/pdf/10.1007%2Fs10120-015-0533-9.pdf