「質の低い研究を多く集めるほど、メタ解析の結論は信頼できなくなります。」
メタ解析(meta-analysis)とは、同一テーマに関する複数の独立した研究を統合し、より大きなサンプルサイズで統計的な結論を導く手法です。単一の研究では検出力が不足するケースでも、複数研究を束ねることでエビデンスの精度を飛躍的に高められます。
医療分野では、ランダム化比較試験(RCT)を対象にしたメタ解析が特に重視されており、EBM(根拠に基づく医療)の頂点に位置するエビデンスレベル「Ia」として扱われています。これは大事なポイントです。
ただし、メタ解析はあくまで「統合する研究の質に依存する」手法です。つまり材料の質が低ければ結論も揺らぎます。この認識が、やり方を学ぶ出発点になります。
メタ解析とシステマティックレビューは混同されやすいですが、両者は別物です。システマティックレビューは文献を体系的に整理・要約するプロセス全体を指し、メタ解析はその中で行われる「定量的な統計統合」の部分だけを指します。セットで実施されることが多いですが、システマティックレビューを行いながらメタ解析を実施しない選択もあります。
メタ解析の第一歩は、明確なリサーチクエスチョンを設定することです。ここで曖昧にすると、後の文献選定・解析すべてに影響します。これが原則です。
リサーチクエスチョンの構造化にはPICOフレームワークを使います。
PICOが固まったら、次に「研究デザインの選定基準」を事前に明文化しておくことが重要です。RCTのみ対象にするのか、観察研究も含めるのかを最初に決めておかないと、後で恣意的な文献選定が疑われます。この作業は「プロトコル登録」とセットで行うのがベストです。
プロトコルはPROSPERO(国際的なシステマティックレビュー登録機関)に事前登録することが推奨されています。登録することで研究の透明性が担保され、査読付き雑誌への投稿でも信頼性の証明になります。登録は無料で行えます。
また、アウトカムは「主要アウトカム」と「副次アウトカム」に分けて事前設定します。解析後に都合のよいアウトカムだけを報告する「アウトカムスイッチング」は研究倫理上の重大な問題です。
文献検索は複数のデータベースを横断して実施するのが鉄則です。PubMedだけで検索を終わらせると、対象文献の3〜4割が抜ける可能性があることが複数の方法論研究で示されています。これは意外ですね。
主な検索データベースは以下の通りです。
検索式はMeSH(医学件名標目)と自由語を組み合わせて構築します。たとえば「diabetes mellitusMeSH AND SGLT2 inhibitortiab」のように、統制語と本文中の単語を両方使うことで検索漏れを防げます。
文献の選定は2名の独立したレビュアーが行い、意見の相違はコンセンサスまたは第三者の判断で解決します。この「独立した2名」という要件は査読でも厳しく確認される部分です。
選定の結果はPRISMAフローチャートとして図示します。「検索件数→重複除外→タイトル・抄録スクリーニング→全文確認→最終採用件数」の流れを可視化することで、研究の透明性を確保できます。
参考として、国内でのPRISMA活用ガイドは以下を参照してください。
PRISMA声明 日本語訳(prisma-statement.org)
採用した文献は個別にバイアスリスクを評価します。この評価を省略すると、質の低い研究が結果に過大な影響を与えます。見落としがちなステップです。
RCTのバイアス評価には「Cochrane Risk of Bias Tool(RoB 2)」が国際標準として使われています。評価項目は以下の5領域です。
観察研究の場合はNOS(Newcastle-Ottawa Scale)が一般的に使われ、各研究を最大9点で評価します。
データ抽出は専用のフォームを用意して行います。抽出すべき情報は、研究の基本情報(著者・発表年・国)、対象集団の特性、介入と比較の詳細、アウトカムの定義と数値(イベント数・サンプルサイズ・平均値・標準偏差など)です。
2名での独立抽出ここでも必要です。一人が抽出し、もう一人が確認するダブルチェック体制が推奨されます。カッパ係数(κ)で一致度を算出し、0.6以上であれば許容できる一致とされています。
Cochrane Japanによるシステマティックレビューの解説(cochrane.org)
統計解析の核心は「どのモデルを使うか」と「異質性をどう扱うか」です。これが基本です。
固定効果モデル(Fixed-effect model)は、すべての研究が同一の真のエフェクトサイズを持つという前提に立ちます。研究間のばらつきは偶然誤差のみで生じると仮定するため、研究デザインや対象集団が高度に均一な場合に適しています。
ランダム効果モデル(Random-effects model)は、研究ごとに異なる真のエフェクトサイズが存在することを想定します。より現実的な状況を反映しており、臨床研究では多くの場合こちらが選ばれます。
異質性の定量化にはI²統計量が使われます。
また、Q検定(Cochran's Q)でI²と合わせて異質性の統計的有意性を確認します。ただしQ検定は研究数が少ないと検出力が低いため、I²と組み合わせて解釈するのが原則です。
異質性が高い場合は「サブグループ解析」や「メタ回帰」で原因を探ります。たとえば年齢層・投与量・研究期間などを説明変数にして、どの因子が結果のばらつきに寄与しているかを検討できます。
解析ソフトウェアは、無料で使えるR(metaパッケージ)やRevMan(Cochraneが提供)が広く使われています。商用ツールではComprehensive Meta-Analysis(CMA)も使いやすいと評価が高いです。
Cochrane Handbook for Systematic Reviews of Interventions(方法論の国際標準テキスト)
森林プロット(forest plot)はメタ解析の結果を視覚化する最重要ツールです。これは必須です。
各研究のエフェクトサイズ(オッズ比・リスク比・平均差など)とその95%信頼区間が横棒で示され、統合推定値がダイヤモンド形で表示されます。正方形の大きさは各研究のウェイト(重み)を表しており、サンプルサイズが大きいほど正方形が大きくなります。
「1.0の垂直線(帰無線)」にダイヤモンドがかかっていれば統計的有意差なし、右側にあれば介入に有利、左側にあれば対照に有利という解釈になります。直感的でわかりやすいですね。
出版バイアスの確認にはファンネルプロット(funnel plot)を使います。これは各研究のエフェクトサイズをx軸に、精度(標準誤差の逆数)をy軸にプロットしたものです。プロットが左右対称な逆三角形を形成していれば出版バイアスは小さい、非対称であれば小さなネガティブ研究が未発表である可能性を示唆します。
ここで多くの医療従事者が見落としがちな点があります。ファンネルプロットの非対称性は出版バイアス以外に「小研究効果(small study effects)」「異質性」「統計的偶然」によっても生じます。つまりファンネルが歪んでいても、その原因が出版バイアスとは限りません。Egger's testやBegg's testで統計的に確認することで、より正確な判断が可能になります。
もう一つの独自視点として、「P-hacking」への警戒が挙げられます。メタ解析においても、解析後に都合のよいサブグループだけを強調する報告は問題です。事前登録したプロトコルと最終報告を照合する「プロトコル遵守確認」が、2020年代以降の査読では標準的に求められるようになっています。投稿前にPRISMA 2020チェックリスト(27項目)を1項目ずつ確認する習慣が、採択率を大きく左右します。
Rのmeta・metaforパッケージを使えば、森林プロット・ファンネルプロット・Egger's testをすべて無料で実施できます。学習コストはかかりますが、長期的には商用ツール不要で完結できます。
PRISMA 2020チェックリスト(日英併記・無料DL可)