臨床試験に必要な知識

略語

CR (complete response)：完全奏功

PR (partial response)：部分奏功

PD (progressive disease)：進行

SD (stable disease)：安定

臨床医学

個々の治療経験に基づくanecdotal（逸話的な）報告

↓

昔のカルテから引き出したデータなど：cherry-picking（良いことだけ選ぶ）

↓

正しい方法論に則ったEBM

様々なルールがあるが、

Ⅰ：安全性

Ⅱ：有効性

ーーーーー→がん・AIDSなど認可

Ⅲ：標準治療との比較

ーーーーーーーーーー→認可（その他）

Ⅳ：毒性

PhaseⅠ：癌とそれ以外は異なる

↓ 有効性が認められたら

PhaseⅡ

NCI-CTCによるToxicity
エンドポイント
効果判定
サンプルサイズ

1. PhaseⅠでも毒性を評価しているが、施設が増えるためもう一度Toxicityの評価

　PhaseⅡ：50～100例（cf. PhaseⅠ：15例）

2. 固形癌→腫瘍縮小効果：どれくらい？→response rate

　胃・卵巣癌の腹水など標的病変が明らかでないとき

　OS rate

　PFS rate

　RR（奏功率）を評価するには標的病変を経時的にフォロー

　RECIST基準（固形癌）

　VICC, WHO：画像上の長径×短径

　ややこしいので一次元（一番長い所）だけで評価＝RECIST

　※測定可能病変：20 mm以上、ヘリカルCT 5 mm以上

WHO：積の和

RECIST：最長径の和

RECIST1.0：1臓器5個まで合計10個

RECIST1.1：1臓器2個まで合計5個

リンパ節は短径15 mm以上で標的臓器←リンパ節は標的臓器として分かりにくい

↓ RECISTが適用しにくい

・PETによる壊死の描出：PERCIST

・癌に対する免疫療法：irRC

・PERCIST

　治療しても小さくならないが、奏功している（= PETでは病変が小さくなっている）

・irRC

　免疫療法には時間がかかるので、

腫瘍縮小
長期間持続したstable disease
一旦腫瘍が増大した後のresponse
新病変を伴う←RECISTではこの時点でPDになる

　WHO基準（縦径×横径＝面積）で出さなくても一次元で同様に評価可能

近年のresponse評価

・RECIST1.1

・PERCIST

・irRC

最良総合評価

CR 4週以上

CT 1ヶ月ごと	1月	2月	3月	4月	5月
腫瘍径	10	7	5	5	6
CT	〇	〇	〇	〇	〇
	治療前	PRin	PR確定	PR	PD

※PRin：ベースライン径に比べて標的病変の径和が30%以上減少

評価：PR→PD

最良総合評価：PR

CT 2ヶ月おき	1月	2月	3月	4月	5月
腫瘍径	10	-	5	-	6
CT	〇	×	〇	×	〇
	治療前		PRin		PD

評価：SD→PD

最良総合評価：SD

【PhaseⅡ】

安全性でなく、奏功率がメイン

CR, PR症例の数がどれくらい（分子としてのCR＋PRが多い方が良い）

サンプルサイズ

SWOGのStatistical Tools

・αエラー：0.05

・閾値生存率

・期待生存率

・βエラー：0.2

閾値生存率と期待生存率の値を変えることでサンプルサイズを恣意的にみることができてしまう

MSTを使う方法もあり

閾値PFS

期待PFS

PhaseⅢがメインだが、PhaseⅡでも予後を確認

PhaseⅡ研究の結果だけでOKの場合もある

：奏功率ではなく、予後に関して明らかに有意差があるデータ

・急性前骨髄性白血病に対するATRA

・慢性骨髄性白血病とGISTに対するImatinib

誰がどう見ても予後やそれに関連したQOLに極めて大きな差がある新治療＝続行は倫理的に問題

しかし、実際には小さな差しか出ない場合が多い

↓ PhaseⅡで有効性が示唆されたら

【PhaseⅢ】

ポイント

1. Randomization

2. Sample size

3. Intention to treat：解析におけるルールの遵守

1. バイアスを避ける

背景の偏り、都合の良い結果解釈、暴露バイアスなど

例.

1936年アメリカ大統領選挙

調査機関	調査人数	ルーズベルト	ランドン
ダイジェスト	238万人	43%	57%
ギャラップ	3000人	54%	46%

↓ 選挙

ルーズベルト：60.2%

ランドン：39.8%

ダイジェストは自動車（共和党支持者の多い白人の中流階級が主）の顧客名簿をもとにした一方、ギャラップは無作為

2. サンプルサイズ←PhaseⅡでのサンプルサイズと異なる

生物統計学的に意味のあるものとするため

①αエラー：あわてものの早合点

②βエラー：うっかりものの見過ごし

　β = 0.2できれば0.1

③予想される生存率の差

④症例集計期間

例. 5年生存率が60～80%の治癒切除後の消化器癌に対する治療

αエラー：0.05

βエラー：0.2

集積期間：2年

平均追跡期間：6年

コントロール群の5年生存率を70%、新治療群の5年生存率を75%（Risk Reduction：20%、生存率改善：5%）とすると必要な症例数は882例である

必要症例数を集積できる見込みのないPhaseⅢ研究を企画することは資金やマンパワーの無駄である

→必要症例数に達しない場合は、小規模なPhaseⅢ、メタアナリシスも考慮できる

3. Intention to Treat

除外・脱落は×

最近では少し融通がきくようになった

PPS (Per Protocol Set)

FAS (Full Analysis Set)

ただしどの方法を用いてもITTの結果は必ず報告

【実臨床へのimplication】

少しの生存率の上昇が患者個人に有用であるのか

生存率の差	治療を希望する患者の割合
1%	50%
3%	62%
5%	73%

→1%上がるだけでも治療を受けたいと思う患者が半数以上

不正

fabrication：データ、結果の偽造

falsification：データ、結果の改ざん

plagiarism：他の研究者のアイデアの剽窃

不正の3大要因

施設要因

臨床医学研究自身が内包する構造的な問題

個人要因

生物統計

詳細にprespecifyしておかない限り、どのような結果でも作り出せる

・途中で経過を絶えず覗いて差のついた時点で結果を出す

・都合の悪い症例をineligibleとして除外して解析

・非劣性試験においてサンプル設計

↓

Central Statistical Monitoring (CSM)：データの質と整合性の担保

他の施設との間で患者集団、データ収集に差はないかみる

ref.

総論：https://www.jstage.jst.go.jp/article/arerugi/53/4/53_KJ00000818882/_pdf

PERCIST：http://jnm.snmjournals.org/content/50/Suppl_1/122S.full

irRC：https://academic.oup.com/jnci/article/100/18/1280/2607204

CSM：https://link.springer.com/content/pdf/10.1007%2Fs10120-015-0533-9.pdf

生命医科学雑記帳

evernoteのバックアップ、twitterに投下した内容のまとめとして使います。
細心の注意は払っているつもりですが、未だ専門分野を持たない研修医であるため、正確性に欠けることがあります。悪しからず。

臨床試験に必要な知識