メタ解析のやり方と医療統計の基本手順

メタ解析のやり方：医療従事者が押さえる基本と実践手順

「質の低い研究を多く集めるほど、メタ解析の結論は信頼できなくなります。」

📊 この記事の3ポイント要約

🔍

文献検索は複数データベースが必須

PubMedだけでなくEmbase・医中誌を併用しないと、対象文献の最大30〜40%が抜け落ちる可能性があります。

📈

異質性（I²）の確認が全体の質を左右する

I²が50%を超える場合は固定効果モデルではなくランダム効果モデルを選択するのが原則です。

✅

PRISMAフローチャートは報告の国際標準

2020年改訂版PRISMAに沿った報告が、国際誌への採択率を高める上で現在最も重要な要件のひとつです。

このページの目次

メタ解析のやり方：医療従事者が押さえる基本と実践手順

メタ解析のやり方：そもそもメタ解析とは何か

メタ解析（meta-analysis）とは、同一テーマに関する複数の独立した研究を統合し、より大きなサンプルサイズで統計的な結論を導く手法です。単一の研究では検出力が不足するケースでも、複数研究を束ねることでエビデンスの精度を飛躍的に高められます。

医療分野では、ランダム化比較試験（RCT）を対象にしたメタ解析が特に重視されており、EBM（根拠に基づく医療）の頂点に位置するエビデンスレベル「Ia」として扱われています。これは大事なポイントです。

ただし、メタ解析はあくまで「統合する研究の質に依存する」手法です。つまり材料の質が低ければ結論も揺らぎます。この認識が、やり方を学ぶ出発点になります。

メタ解析とシステマティックレビューは混同されやすいですが、両者は別物です。システマティックレビューは文献を体系的に整理・要約するプロセス全体を指し、メタ解析はその中で行われる「定量的な統計統合」の部分だけを指します。セットで実施されることが多いですが、システマティックレビューを行いながらメタ解析を実施しない選択もあります。

🔬 エビデンスレベル：個別のRCT（Ib）よりも上位（Ia）

📚 対象：RCT・観察研究・コホート研究など目的に応じて設定

⚠️ 注意点：ゴミを集めてもゴミしか出ない（Garbage in, garbage out）

メタ解析のやり方：リサーチクエスチョンとPICO設定の手順

メタ解析の第一歩は、明確なリサーチクエスチョンを設定することです。ここで曖昧にすると、後の文献選定・解析すべてに影響します。これが原則です。

リサーチクエスチョンの構造化にはPICOフレームワークを使います。

P（Patient/Population）：対象集団（例：2型糖尿病患者）

I（Intervention）：介入（例：SGLT2阻害薬の投与）

C（Comparison）：比較対象（例：プラセボまたは他の降糖薬）

O（Outcome）：アウトカム（例：心血管イベントの発生率）

PICOが固まったら、次に「研究デザインの選定基準」を事前に明文化しておくことが重要です。RCTのみ対象にするのか、観察研究も含めるのかを最初に決めておかないと、後で恣意的な文献選定が疑われます。この作業は「プロトコル登録」とセットで行うのがベストです。

プロトコルはPROSPERO（国際的なシステマティックレビュー登録機関）に事前登録することが推奨されています。登録することで研究の透明性が担保され、査読付き雑誌への投稿でも信頼性の証明になります。登録は無料で行えます。

また、アウトカムは「主要アウトカム」と「副次アウトカム」に分けて事前設定します。解析後に都合のよいアウトカムだけを報告する「アウトカムスイッチング」は研究倫理上の重大な問題です。

メタ解析のやり方：文献検索と選定基準の具体的な進め方

文献検索は複数のデータベースを横断して実施するのが鉄則です。PubMedだけで検索を終わらせると、対象文献の3〜4割が抜ける可能性があることが複数の方法論研究で示されています。これは意外ですね。

主な検索データベースは以下の通りです。

🌐 PubMed/MEDLINE：英語圏の医学文献の中心

🌐 Embase：欧州系・薬学領域に強い（有料）

🇯🇵 医中誌Web：日本語文献に不可欠

🌐 Cochrane Library：システマティックレビューの集積データベース

📄 ClinicalTrials.gov：未発表試験の把握に有用

検索式はMeSH（医学件名標目）と自由語を組み合わせて構築します。たとえば「diabetes mellitusMeSH AND SGLT2 inhibitortiab」のように、統制語と本文中の単語を両方使うことで検索漏れを防げます。

文献の選定は2名の独立したレビュアーが行い、意見の相違はコンセンサスまたは第三者の判断で解決します。この「独立した2名」という要件は査読でも厳しく確認される部分です。

選定の結果はPRISMAフローチャートとして図示します。「検索件数→重複除外→タイトル・抄録スクリーニング→全文確認→最終採用件数」の流れを可視化することで、研究の透明性を確保できます。

参考として、国内でのPRISMA活用ガイドは以下を参照してください。

PRISMA声明日本語訳（prisma-statement.org）

メタ解析のやり方：バイアスリスク評価とデータ抽出の方法

採用した文献は個別にバイアスリスクを評価します。この評価を省略すると、質の低い研究が結果に過大な影響を与えます。見落としがちなステップです。

RCTのバイアス評価には「Cochrane Risk of Bias Tool（RoB 2）」が国際標準として使われています。評価項目は以下の5領域です。

ランダム化プロセスのバイアス

意図した介入からの逸脱によるバイアス

アウトカムデータの欠損によるバイアス

アウトカム測定のバイアス

選択的報告によるバイアス

観察研究の場合はNOS（Newcastle-Ottawa Scale）が一般的に使われ、各研究を最大9点で評価します。

データ抽出は専用のフォームを用意して行います。抽出すべき情報は、研究の基本情報（著者・発表年・国）、対象集団の特性、介入と比較の詳細、アウトカムの定義と数値（イベント数・サンプルサイズ・平均値・標準偏差など）です。

2名での独立抽出ここでも必要です。一人が抽出し、もう一人が確認するダブルチェック体制が推奨されます。カッパ係数（κ）で一致度を算出し、0.6以上であれば許容できる一致とされています。

Cochrane Japanによるシステマティックレビューの解説（cochrane.org）

メタ解析のやり方：固定効果・ランダム効果モデルと異質性検定の読み方

統計解析の核心は「どのモデルを使うか」と「異質性をどう扱うか」です。これが基本です。

固定効果モデル（Fixed-effect model）は、すべての研究が同一の真のエフェクトサイズを持つという前提に立ちます。研究間のばらつきは偶然誤差のみで生じると仮定するため、研究デザインや対象集団が高度に均一な場合に適しています。

ランダム効果モデル（Random-effects model）は、研究ごとに異なる真のエフェクトサイズが存在することを想定します。より現実的な状況を反映しており、臨床研究では多くの場合こちらが選ばれます。

異質性の定量化にはI²統計量が使われます。

🟢 I² < 25%：低い異質性（固定効果モデルでも可）

🟡 I² 25〜50%：中程度の異質性

🔴 I² > 50%：高い異質性（ランダム効果モデルを選択）

🚨 I² > 75%：異質性が非常に高く、統合自体の妥当性を再検討

また、Q検定（Cochran's Q）でI²と合わせて異質性の統計的有意性を確認します。ただしQ検定は研究数が少ないと検出力が低いため、I²と組み合わせて解釈するのが原則です。

異質性が高い場合は「サブグループ解析」や「メタ回帰」で原因を探ります。たとえば年齢層・投与量・研究期間などを説明変数にして、どの因子が結果のばらつきに寄与しているかを検討できます。

解析ソフトウェアは、無料で使えるR（metaパッケージ）やRevMan（Cochraneが提供）が広く使われています。商用ツールではComprehensive Meta-Analysis（CMA）も使いやすいと評価が高いです。

Cochrane Handbook for Systematic Reviews of Interventions（方法論の国際標準テキスト）

メタ解析のやり方：森林プロット・出版バイアスの確認と独自視点での落とし穴

森林プロット（forest plot）はメタ解析の結果を視覚化する最重要ツールです。これは必須です。

各研究のエフェクトサイズ（オッズ比・リスク比・平均差など）とその95%信頼区間が横棒で示され、統合推定値がダイヤモンド形で表示されます。正方形の大きさは各研究のウェイト（重み）を表しており、サンプルサイズが大きいほど正方形が大きくなります。

「1.0の垂直線（帰無線）」にダイヤモンドがかかっていれば統計的有意差なし、右側にあれば介入に有利、左側にあれば対照に有利という解釈になります。直感的でわかりやすいですね。

出版バイアスの確認にはファンネルプロット（funnel plot）を使います。これは各研究のエフェクトサイズをx軸に、精度（標準誤差の逆数）をy軸にプロットしたものです。プロットが左右対称な逆三角形を形成していれば出版バイアスは小さい、非対称であれば小さなネガティブ研究が未発表である可能性を示唆します。

ここで多くの医療従事者が見落としがちな点があります。ファンネルプロットの非対称性は出版バイアス以外に「小研究効果（small study effects）」「異質性」「統計的偶然」によっても生じます。つまりファンネルが歪んでいても、その原因が出版バイアスとは限りません。Egger's testやBegg's testで統計的に確認することで、より正確な判断が可能になります。

もう一つの独自視点として、「P-hacking」への警戒が挙げられます。メタ解析においても、解析後に都合のよいサブグループだけを強調する報告は問題です。事前登録したプロトコルと最終報告を照合する「プロトコル遵守確認」が、2020年代以降の査読では標準的に求められるようになっています。投稿前にPRISMA 2020チェックリスト（27項目）を1項目ずつ確認する習慣が、採択率を大きく左右します。