あなたが外した1例が、有効性を2倍に“水増し”します。
cmic-hci(https://www.cmic-hci.com/blog/gcp45)
orthomedico(https://www.orthomedico.jp/news-release/e-mail-magazine/mm-250602.html)
bmj(https://www.bmj.com/content/350/bmj.h2445)
多くの医療従事者がまず知っているのは、「intention to treat(ITT)=最初にランダム化した群のまま、全症例を解析する」という定義です。 典型的な説明では、「治療を最後まで受けたかどうかに関係なく、当初の割付けどおりに解析する」とされ、これは英和辞典の定義とも一致します。 つまり、「治療を実際に完遂したか」ではなく、「治療しようと意図して割りつけたか」を重視する考え方です。 oncolo(https://oncolo.jp/dic/intention-to-treat)
この原則が重視される理由は、大きく2つあります。1つは、ランダム化によって介入以外の患者背景を均等化している以上、解析段階で症例を除外すると、そのバランスが崩れてバイアスが入りやすくなることです。 もう1つは、日常診療では服薬アドヒアランスや脱落が常に起こるため、「完璧に治療を受けた人だけ」で評価するよりも、「方針としてその治療を採用した場合にどの程度の効果が期待できるか」を反映できる点です。 oncolo(https://oncolo.jp/dic/intention-to-treat-analysis)
ITT解析のイメージとして、例えば対照群100例と治療群100例を無作為割付けした試験を考えます。 実際には、治療群のうち10例が早期中止、5例がフォローアップ脱落したとしても、ITTでは「本来の100対100」のセットで効果を推定しようとします。脱落例のアウトカムの扱いには方法の違いがありますが、「割付けどおりに含める」という原則は維持されます。 wellness-news.co(https://wellness-news.co.jp/posts/%E3%82%A8%E3%83%93%E3%83%87%E3%83%B3%E3%82%B9%E5%85%A5%E9%96%80%EF%BC%8846%EF%BC%89%E3%80%80%E8%87%A8%E5%BA%8A%E8%A9%A6%E9%A8%93%E3%81%AB%E3%81%8A%E3%81%91%E3%82%8B%E8%A7%A3%E6%9E%90%E9%9B%86%E5%9B%A3/)
この考え方により、ITT解析は「実践的な治療効果(pragmatic effect)」を示すと説明されます。 患者さんに「この薬を標準治療として採用したとき、現実の現場でどの程度のベネフィットが見込めるか」を答える指標として解釈しやすいからです。つまり「実臨床に近い効果を見るための前提」ということですね。 yakugai.gr(https://www.yakugai.gr.jp/attention/attention.php?id=374)
一方で、ITTは必ずしも「最も楽観的な結果」を示すわけではありません。服薬不遵守例や途中中止例が多いと、治療効果は希釈され、見かけ上は有効性が小さく見えることもあります。 そのため、多くの臨床試験では、ITT(あるいはFAS)に加えて、PPS(per protocol set)など、遵守例に限定した解析も併記されます。 ここが「ITTの意味=常に一番信頼できる数字」という誤解が生まれやすいポイントです。結論は、ITTはバイアスを抑えつつ実臨床を反映するが、常に最大効果を示すわけではない、ということです。 editverse(https://editverse.com/ja/intention-to-treat-per-protocol-analysis/)
ITTの意味を正しく理解するには、よく一緒に出てくるFAS(full analysis set)、PPS(per protocol set)、on-treatment解析との違いを整理する必要があります。 まずITTは、「ランダム化された全症例を、割付けどおりに解析する」というもっとも広い解析集団です。 一方、FASはICH-E9が提唱する実務的な妥協として、「ITTに近いが、重大な規約違反やベースラインデータ欠損など、事前に定めた最小限の除外基準を満たした症例のみを含める」集団と説明されます。 best-biostatistics(https://best-biostatistics.com/review/itt_fas_pps.html)
具体例でイメージするとわかりやすくなります。例えば治療群100例のうち、登録後まったく来院せずベースラインデータも取得できなかった1例、明らかな登録ミスで適格基準を満たしていなかった2例がいたとします。 Strict ITTの立場では、この3例も原則として含めるべきですが、FASでは「事前に定めた」基準に従って除外され、実際に解析されるのは97例となります。 つまりFASは、「ほぼITTだが、現実的なデータ品質管理を反映した集団」ということですね。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/g75una0000000f69-att/DS_202303_protocol.pdf)
一方、PPSはFASよりさらに絞り込み、治験実施計画書に沿って治療・フォローアップが実施された症例だけを含める解析集団です。 服薬アドヒアランスの大きな逸脱や、重要なプロトコル違反がある症例は除外されます。これは「理想的条件で治療が行われた場合の効果」を見る目的で使われ、ITTよりも治療効果が大きく見える傾向があります。 media-ctms(https://www.media-ctms.com/basic/analysis.html)
さらに、on-treatment解析(as-treated解析とも呼ばれる)は、「実際に受けた治療内容に基づいて群を再定義」する方法です。 たとえば、対照群で途中から治療薬を開始した患者を「治療群」に移したり、治療群で全く薬を受けなかった患者を対照群から除外するといった操作が行われます。 これは「服薬実態に即した効果」を見るには便利ですが、ランダム化のバランスが崩れるため、選択バイアスを強く受けるリスクがあります。 statg(https://statg.com/oyo/ittt.html)
こうした違いを踏まえると、論文の結果を読む際には、「ITT(またはFAS)での結果」と「PPSやon-treatmentでの結果」のギャップを見ることが大切になります。 ITTでのハザード比が0.85、PPSで0.70と大きな差がある場合、実臨床で期待できる効果と、理想条件での効果がどの程度違うのかをイメージしやすくなるからです。つまりITTが基本です。 yakugai.gr(https://www.yakugai.gr.jp/attention/attention.php?id=374)
実務上のリスク管理としては、「承認審査やガイドラインでは、原則としてITTまたはFASを主要解析として扱っている」という流れを押さえておくと、添付文書のエビデンスを解釈しやすくなります。 そのうえで、学会発表などでPPSだけが強調されている場合は、「ITTではどれくらいの効果だったのか」を確認することが、過大評価を避けるうえで有効です。つまり比較が重要です。 pmda.go(https://www.pmda.go.jp/files/000156112.pdf)
その結果、「意図したITT解析から逸脱した」と報告している試験群では、標準的ITT解析に忠実な試験群に比べて、治療効果の推定値が有意に大きくなっていました。 具体的には、ITTからの逸脱がある試験のオッズ比やリスク比は、平均して数パーセントから1割程度、介入に有利な方向に傾いていたと報告されています(メタ解析全体の要約効果)。 この「数%~1割」という差は、一見小さく見えますが、ベースラインリスクが高い疾患や大規模な公衆衛生介入では、絶対リスク減少やNNT(治療必要数)にしてみると相当な差になります。結論は、mITTは慎重に読むべきということです。 bmj(https://www.bmj.com/content/350/bmj.h2445)
mITTの典型的な定義としては、「ランダム化され、少なくとも1回は治験薬を服用した症例」や、「ベースライン測定を完了した症例」などが挙げられます。 一見すると妥当な条件に見えますが、「治療を一度も開始しなかった症例」や「早期の有害事象で中止された症例」が除外されることで、実際の有効性・安全性が過小評価・過大評価される可能性が出てきます。 特に、早期に副作用で中止した患者を除外すると、安全性プロファイルが実際より良く見えることは、日常診療の感覚からも容易にイメージできるはずです。これは厳しいところですね。 arxiv(https://arxiv.org/pdf/2206.10453.pdf)
さらに、別のメタ・エピデミオロジー研究では、「modifiedという言葉を明示的に使っていなくても、実際にはmITTに近い運用をしている試験」が一定数存在することも指摘されています。 報告書上は「ITT解析」と書かれていても、細かく読むと「少なくとも1回は治療を受けた症例のみを含めた」といった条件が記載されているケースです。 こうした微妙な逸脱が積み重なると、臨床家が文献の数字をそのまま現場に持ち込んだときに、「思ったほど効かない」「思ったより有害事象が多い」と感じるギャップにつながりかねません。つまり表現に注意すれば大丈夫です。 orthomedico(https://orthomedico.jp/static/clinical-trials/words/intention-to-treat-principle.html)
臨床現場でこのリスクを減らすためには、論文を読む際に次のような行動を1つだけ徹底するのがおすすめです。まず、「解析対象集団」の項目を必ず確認し、「ランダム化された全症例を含めた」と明示されているかをチェックします。 そのうえで、「少なくとも1回投与された症例」「ベースライン評価完了例」といった条件が付いていないかを確認し、もし付いていれば「これはmITTに近い」と意識して効果量を解釈します。 こうした「ひと手間の読み方」をルーチンに組み込むだけで、治療効果の過大評価による診療上の損失をかなり減らせます。結論は確認の習慣です。 cmic-hci(https://www.cmic-hci.com/blog/gcp45)
ITTの原則は「ランダム化された全症例を解析に含める」ですが、ICH-E9や日本語の実務解説では、「例外が全く許されない」とまでは書かれていません。 現実の治験では、登録ミスや重複登録、倫理的にフォローアップ継続が不可能になった症例など、どうしても除外せざるを得ないケースが存在します。 そこで重要になるのが、「どのような症例は、事前に解析対象から除外してもよいか」を明確に定義しておくことです。これは実務の話です。 wellness-news.co(https://wellness-news.co.jp/posts/%E3%82%A8%E3%83%93%E3%83%87%E3%83%B3%E3%82%B9%E5%85%A5%E9%96%80%EF%BC%8846%EF%BC%89%E3%80%80%E8%87%A8%E5%BA%8A%E8%A9%A6%E9%A8%93%E3%81%AB%E3%81%8A%E3%81%91%E3%82%8B%E8%A7%A3%E6%9E%90%E9%9B%86%E5%9B%A3/)
エビデンス入門の記事や製薬協の資料では、ICH-E9の考え方に基づき、「解析対象集団と除外症例は、治験実施計画書であらかじめ定義すべき」「データ解析中に後付けで除外基準を変更するのは好ましくない」と繰り返し強調されています。 たとえば「適格基準を満たしていなかった症例」「インフォームドコンセントが法的に無効と判明した症例」などは、事前に『解析から除外する可能性のある症例』として明記しておく必要があります。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000b4ql-att/estimand_analysis.pdf)
ここでイメージしてみましょう。100例ずつのランダム化試験で、登録ミスにより適格でない患者が治療群に3例、対照群に0例入っていたとします。 解析段階でこれら3例を治療群からだけ除外すると、治療群のサンプルサイズは97例、対照群は100例のままになり、ベースラインのバランスが崩れます。 しかも、これらの症例のアウトカムが平均より悪かった場合、治療効果が過大評価される方向にバイアスがかかる可能性があります。 つまり、何を除外するかは結果を動かす要因です。 statg(https://statg.com/oyo/ittt.html)
実務的な対策として、治験側(スポンサーやCRO)は、統計解析計画書(SAP)で「ITT集団」「FAS」「PPS」といった解析集団を明確に定義し、それぞれの除外基準を事前に定めることが求められます。 医療従事者の立場では、論文や治験結果要約を見る際に、「ITTと書いてあるが、実際の除外基準はどうなっているか」「FASの定義は何か」を確認することで、「原則からの逸脱がどの程度あるか」を推定できます。 これが、先ほどのBMJ研究で示されたような「逸脱による過大評価」を見抜く第一歩になります。 orthomedico(https://www.orthomedico.jp/news-release/e-mail-magazine/mm-250602.html)
もうひとつ意外と見落とされがちなのが、「途中で解析集団の定義を変えること」のリスクです。PMDAの統計ガイダンスでは、治験実施計画書違反や被験者の結果を知った後で解析から被験者を除外することは、偏りの原因となり得ると明確に指摘されています。 これは、例えば「主要評価項目で有意差が出なかったので、特定のプロトコル違反群を除外して再解析した」といった操作を指します。 こうした事後的な操作は、p値を人為的に有意方向に動かす「P-hacking」にもつながりうるため、医療従事者としては、論文中に「post-hoc解析」「感度分析」と書かれている部分は慎重に読む必要があります。 つまり事前定義が条件です。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000b4ql-att/estimand_analysis.pdf)
最後に、ITTの意味を理解したうえで、医療従事者が日常診療にどう活かすかを整理します。ランダム化比較試験の論文を読む場面では、まず「試験デザイン」→「解析対象集団」→「主要評価項目」という順に、ざっくり構造を把握することが多いはずです。そのうえで、「この試験はITT(またはFAS)で主要解析をしているか」「PPSとの結果の差はどの程度か」を意識的に確認すると、数字の意味が一段階クリアになります。 best-biostatistics(https://best-biostatistics.com/review/itt_fas_pps.html)
例えば、新しい心不全治療薬の試験で、ITT解析(FASに相当)でのハザード比が0.80、PPSで0.70と報告されていたとします。 このとき、ITTの0.80は「実臨床で標準治療として使った場合の、服薬不遵守や脱落も含めた現実的な効果」を示していると解釈できます。一方、PPSの0.70は「ガイドラインどおりに、しっかりと用量調整とフォローアップを行った場合の理想的な効果」に近いと考えられます。 現場では、「平均的な患者さんには0.80のほうがイメージに近いが、チームでアドヒアランス支援を徹底できれば、0.70に近い効果も期待できるかもしれない」といった形で、患者背景や医療資源を踏まえて解釈することになります。つまり二段階の読み方です。 editverse(https://editverse.com/ja/intention-to-treat-per-protocol-analysis/)
ITインフラやツールの面では、PubMedや医中誌のアラート機能、あるいは製薬企業や学会が配信する論文ダイジェストを活用し、「特定疾患領域の主要RCTについて、ITTかmITTかを一覧でチェックする」というスタイルも考えられます。 こうした情報を1つのスプレッドシートや院内の共有ノートにまとめておけば、新しい治療法が出てきたときに、「この薬はITTできちんと有効性が示されているか」「主要なエビデンスはPPS中心か」といった視点で、科内カンファレンスの議論をスムーズに進めることができます。これは使えそうです。 pmc.carenet(https://pmc.carenet.com/?pmid=26016488&keiro=journal)
最後に、患者さんへの説明にどう反映するかという観点も重要です。ITTの結果をベースにして、「この薬を今の病棟や外来の体制で使ったとき、どのくらいリスクが下がりそうか」を、絶対リスク減少やNNTに換算して伝えると、患者さんも納得しやすくなります。 一方で、「もしガイドラインどおりにしっかり通院・服薬・生活習慣改善ができれば、さらにこれくらい上乗せで効果が期待できます」と、PPSやサブ解析の結果を補足情報として提示するのも有効です。 こうした説明は、アドヒアランス向上にも直結します。アドヒアランスが基本です。 oncolo(https://oncolo.jp/dic/intention-to-treat-analysis)
最後に、intention to treatの意味をさらに深く理解したい医療従事者向けに、日本語でアクセスしやすいリソースと、学習の進め方のヒントをまとめます。まず、がん領域の臨床試験情報を提供しているオンコロの用語解説では、ITT解析やon-treatment解析の違いがシンプルに紹介されており、「なぜ脱落例を除外すると偏りが出るのか」をイメージで捉えやすくなっています。 また、日本臨床疫学会や関連団体の用語集も、治療企図解析(ITT解析)を簡潔に説明しており、研修医や若手医師への教育資料として使いやすいでしょう。 jspt.or(https://www.jspt.or.jp/ebpt_glossary/intention-to-treat-analysis.html)
統計的原則のより公式な解説としては、PMDAが公開しているICH-E9「臨床試験のための統計的原則」の日本語版や、製薬協のestimand関連資料が参考になります。 これらはやや硬めの文書ですが、「解析対象集団」「中間事象(intercurrent events)」「感度分析」など、近年の治験設計を理解するためのキーワードが体系的に整理されています。特に、estimandの議論では、「ITT的な考え方」と「特定の中間事象(治療中止、救済治療など)をどう扱うか」が明示的に分けて説明されており、mITTやPP解析の位置づけをよりクリアに理解する助けになります。 pmda.go(https://www.pmda.go.jp/files/000156112.pdf)
英語文献に抵抗がなければ、先述のBMJ論文(Deviation from intention to treat analysis in randomised trials and treatment effect estimates)が非常に示唆に富んでいます。 メソッドの詳細まで読み込む必要はなく、「ITTからの逸脱がどの程度、治療効果を過大評価していたか」「どんな逸脱がよく見られたか」といった結果の部分だけでも、十分に臨床的示唆が得られます。併せて、CONSORT声明や最新版の解説(たとえば2025年に公表されたCONSORT2025の解説)を読むと、報告書で「解析対象集団をどう記載すべきか」の国際的なコンセンサスも把握できます。 bmj(https://www.bmj.com/content/350/bmj.h2445)
学習を継続するうえでは、単に定義を暗記するのではなく、「身近なRCT論文を1本選び、ITT・FAS・PPS・mITTのどれが使われているかを分類してみる」ことが有効です。 例えば、循環器内科であれば主要な心不全治療薬のRCT、腫瘍内科であれば1つのがん種について1剤を決めて、その薬のピボタル試験をいくつかピックアップし、表に整理してみます。「試験名」「疾患」「介入」「対照」「解析集団の定義」「ITTかどうか」「mITTやPPSの併記の有無」といった項目を列にしていくと、自分の専門領域における「ITTの使われ方の癖」が見えてきます。 つまり手元の論文で練習ということですね。 oncolo(https://oncolo.jp/dic/intention-to-treat)
最後に、臨床現場で役立つツールとしては、統計教育サイトやeラーニングも挙げられます。国内外の多くのサイトが、ITT解析やPPS解析をシミュレーション付きで解説しており、簡単なエクセル例をダウンロードして自分で数字を変えてみることで、「1例の除外がどのくらい効果量を動かすか」を体感できます。 10例規模の玩具データでも、「脱落例を治療群からだけ除く」とハザード比やリスク比が大きく動く様子はすぐわかります。こうした「手を動かすトレーニング」は、論文を読むときの感覚を大きく変えてくれます。結論は、自分で動かすと腑に落ちるということです。 media-ctms(https://www.media-ctms.com/basic/analysis.html)
このh3全体で参照した内容の詳細な公式解説として、ITT解析の定義とFAS・PPSとの違い、実務上の運用を日本語で整理したページです。 best-biostatistics(https://best-biostatistics.com/review/itt_fas_pps.html)
治療の意図(ITT)、FAS、PPSの違いに関する日本語解説