リアルワールドデータで臨床研究の質を高める実践法

リアルワールドデータを活用した臨床研究は、医療従事者にとって新たなエビデンス創出の手段として注目されています。RCTとの違いや活用上の注意点を知っていますか?

リアルワールドデータと臨床研究の基礎から実践まで

RWDを使えば研究倫理審査が不要だと思っていると、研究計画ごと白紙になります。


📋 この記事の3ポイント要約
🔬
RWDとは何か

リアルワールドデータとは、日常診療で蓄積される電子カルテ・レセプト・患者登録情報などの実臨床データ。RCTでは対象外となる高齢者や多疾患合併患者への薬剤効果を検証できます。

⚠️
活用時の落とし穴

RWDは交絡因子のコントロールが難しく、傾向スコア解析などの統計手法が必須。倫理審査の免除は「既存情報の二次利用」に限定され、連結可能匿名化データでも審査が原則必要です。

医療従事者が今すぐできること

MID-NETやNDBなどの公的データベースへのアクセス申請手順を把握し、研究デザインの段階からバイオ統計家と連携することが、質の高いRWE創出への近道です。


リアルワールドデータの定義と臨床研究における位置づけ


リアルワールドデータ(RWD)とは、日常の臨床現場で生成・収集されるあらゆる健康関連データの総称です。具体的には、電子カルテ(EMR/EHR)、レセプトデータ、疾患レジストリ、医療機器からの測定値、さらには患者報告アウトカム(PRO)などが含まれます。


RCT(ランダム化比較試験)が厳密な条件設定のもとで行われるのに対し、RWDは制限のない実臨床環境から得られる点が大きな違いです。つまり、RCTの「理想の世界」に対してRWDは「現実の世界」のデータといえます。


日本では、厚生労働省が2019年に「リアルワールドデータの利活用に向けた基盤整備」を推進し始め、MID-NET(医療情報データベース基盤整備事業)が約400万人規模のデータを保有するまでに成長しました。医薬品の製造販売後調査にも活用されており、承認後の安全性・有効性評価に欠かせない存在になっています。


これが基本です。


RWDから生成されたエビデンスは「リアルワールドエビデンス(RWE)」と呼ばれ、規制当局への申請資料にも使われるケースが増えています。FDAは2018年に「Real-World Evidence Framework」を発表し、医薬品承認へのRWE活用を正式に認める方針を示しました。日本のPMDAも同様の検討を進めており、医療従事者にとってRWDへの理解は今後ますます重要になります。


  • 📂 電子カルテデータ:診断名・処方・検査値・バイタルなどを含む最も豊富なRWD源
  • 🧾 レセプトデータ:国民の約9割をカバーするNDBは日本最大規模のRWD
  • 📋 疾患レジストリ:希少疾患や特定疾患の長期追跡に不可欠な患者登録データベース
  • 📱 ウェアラブルデバイスデータ:心拍・歩数・睡眠などの連続的な生活データ(活用は発展途上)


リアルワールドデータを用いた臨床研究のデザインと交絡因子対策

RWDを使った臨床研究で最も頭を悩ませるのが、交絡因子(Confounding factor)の存在です。RCTではランダム割り付けによって交絡を排除できますが、観察研究であるRWD研究では処置群と対照群の背景が不均一になりがちです。


交絡因子とは何でしょうか?


たとえば「A薬を投与された患者は死亡率が低い」というデータがあっても、A薬が処方される患者はもともと病態が軽い場合があります。この「病態の軽さ」が交絡因子となり、薬の真の効果を過大評価してしまいます。これをバイアスといいます。


この問題を解決する代表的な手法が傾向スコア解析(Propensity Score Analysis)です。傾向スコアとは「ある患者が特定の治療を受ける確率」を共変量から推定したスコアで、このスコアでマッチングやIPW(逆確率重み付け)を行うことで、疑似的なランダム割り付けに近い状態を作り出せます。


  • ⚖️ 傾向スコアマッチング:スコアが近い患者同士をペアにして比較する手法。直感的に理解しやすい
  • 📊 IPW(逆確率重み付け):全患者を使ったまま重み付けで調整するため、サンプル数を減らさない利点がある
  • 🔢 操作変数法:地域差・医師の処方傾向など外的要因を利用して交絡を排除する上級手法
  • 📐 Difference-in-differences(差の差分析):政策変更前後の差を比較することで未観測交絡を制御する


研究デザインの段階からバイオ統計家を巻き込むことが原則です。後から「統計が合わない」と気づいても、収集済みデータでは対処できない場合があります。特に後ろ向きコホート研究では、測定されていない交絡因子(未測定交絡)が常に問題になることを念頭に置いておきましょう。


参考として、傾向スコア解析の実装についてはRやSASのパッケージが充実しており、日本では「MatchIt」パッケージ(R言語)が広く使われています。


リアルワールドデータ活用における倫理審査と個人情報保護の実務

RWDを二次利用する臨床研究でも、倫理審査は原則として必要です。これは見落としやすい点なので注意が必要です。


2021年に全面改正された「人を対象とする生命科学・医学系研究に関する倫理指針(生命・医学系指針)」では、既存試料・情報のみを使う研究であっても、機関の長の許可と倫理審査委員会への申請が基本とされています。「カルテデータを使うだけだから審査不要」という判断は誤りです。


ただし例外もあります。


匿名加工情報を使用し、かつ研究対象者への侵襲や介入を伴わない場合には、倫理審査委員会への届出のみで実施できるケースがあります(指針第13条)。ただし「匿名加工」の定義は厳格で、氏名・生年月日・住所・個人識別符号を除去するだけでなく、連結不可能な状態にする必要があります。


  • 📝 インフォームドコンセント(IC)の取得:原則必要。ただし研究の種類によってオプトアウトが認められる場合がある
  • 🔒 個人情報保護法との関係:2022年改正で「仮名加工情報」が新設され、社内での分析目的に限り第三者提供なしで活用可能に
  • 🏥 病院内でのデータ利用:診療目的以外の利用は患者への通知またはオプトアウト公表が必要
  • 🌐 多施設共同研究:代表機関での一括審査(一括審査制度)の活用で手続きを効率化できる


倫理審査の手続きを怠ると、論文投稿時に掲載拒否となるリスクがあります。国際誌ではICMJEガイドラインに従った倫理承認番号の記載が必須であり、承認なしの研究は査読の段階で却下されます。これは時間とコストの大きな損失です。


厚生労働省の生命・医学系指針本文および解説はこちらで確認できます。
厚生労働省|人を対象とする生命科学・医学系研究に関する倫理指針


NDBやMID-NETなど日本の主要リアルワールドデータベースの特徴と申請方法

日本にはRWD研究に活用できる公的データベースがいくつか整備されており、それぞれ特徴と申請手続きが異なります。


まず最も規模が大きいのがNDB(National Database:レセプト情報・特定健診等情報データベース)です。約1億人分のレセプトデータと特定健診データが収録されており、厚生労働省が管理しています。研究利用には「特別抽出申出」が必要で、申請から利用開始まで通常6〜12か月かかります。費用は申請内容によりますが、数十万円規模になることもあります。


次にMID-NET(Medical Information Database Network)はPMDAが運営し、協力医療機関の電子カルテ・レセプト・DPC情報を連結した約400万人規模のデータベースです。医薬品の安全対策や製造販売後調査での活用が主目的で、製薬企業や大学・研究機関が申請できます。


  • 🏛️ NDB:対象約1億人、レセプト+特定健診、厚労省管理、申請まで半年〜1年
  • 🔬 MID-NET:約400万人、電子カルテ連結、PMDA管理、医薬品安全対策向け
  • 🧬 DPC(診断群分類)データ:急性期入院患者の詳細な臨床情報、病院単位での研究に利用
  • 🦷 各学会・疾患レジストリ:がん登録(全国がん登録)・循環器疾患・難病など疾患特異的データ


申請のポイントは研究計画の明確さです。「どの薬剤の、どの期間の、どのアウトカムを調べるか」を具体的に記載しないと差し戻しになります。また、データ利用に際してはセキュリティ要件(専用端末・閉じたネットワーク環境)が課せられるため、施設のICT部門との事前調整も必要です。


MID-NET利用申請の詳細はPMDA公式サイトで確認できます。
PMDA|MID-NET(医療情報データベース)の利用申請について


リアルワールドデータ研究で見落とされがちな「アウトカム定義」の精度問題

RWD研究において、検索上位の記事でほとんど触れられていない重要な落とし穴が「アウトカム定義の精度」です。これは独自視点から強調したいポイントです。


レセプトデータや電子カルテを使った研究では、アウトカム(結果指標)を「病名コード(ICD-10)」や「処方コード」で定義するのが一般的です。しかし、実臨床ではコーディングの精度が施設や医師によって大きくばらつきます。


どういうことでしょうか?


たとえば「急性心筋梗塞(AMI)」をICD-10コード「I21」で定義した場合、実際にはAMIではなく不安定狭心症心不全がコードされているケースが混在することがあります。米国の研究では、レセプトベースのAMI定義の陽性適中率(PPV)は施設によって60〜95%と大きな幅があると報告されています。


この「ミスコーディング」が研究結果に与える影響は小さくありません。


  • 📉 感度・特異度の低下:アウトカム定義の誤りは、治療効果の過小評価・過大評価につながる
  • 📋 バリデーション研究の重要性:一部の患者でカルテ照合を行い、定義の妥当性(PPV・感度)を確認する作業が質を担保する
  • 🔄 複合定義の活用:「病名コード+処置コード+薬剤コード」を組み合わせることでPPVを向上させる手法が推奨される
  • 🧪 感度分析の実施:異なるアウトカム定義で結果の頑健性を確認することが論文投稿の必須条件になりつつある


バリデーション研究を省くと、論文の査読で「アウトカムの妥当性が示されていない」と指摘されるリスクが高まります。研究計画書の段階でバリデーション用のサブサンプル(通常100〜200例)を確保する設計にしておくことが、後悔しないための一手です。


また、アウトカム定義の精度問題はデータ取得元の質にも左右されます。DPCデータは診断精度が比較的高い一方、外来レセプトのみでは重症度情報が欠落しやすい点も覚えておきましょう。


リアルワールドデータ活用によるリアルワールドエビデンスの創出と医療実践への応用

RWDを正しく活用することで生み出されるリアルワールドエビデンス(RWE)は、今後の医療の意思決定を大きく変える可能性を持っています。


既に実例はあります。


日本では2020年頃から、COVID-19パンデミック対応においてレセプトデータや電子カルテデータの緊急分析が行われました。特定の基礎疾患を持つ患者群の重症化リスクを短期間で推定し、ワクチン優先接種の政策立案に役立てた事例はRWEの実力を証明しています。


また、希少疾患の治療薬承認においてもRWEの役割は増しています。RCTで十分な症例数が集められない希少疾患では、患者レジストリから得られたRWDが有効性・安全性のエビデンスとして規制当局に提出されるケースが世界的に増加中です。


  • 💊 薬剤疫学研究:上市後の薬剤の有効性・安全性を実臨床で検証。特に長期アウトカムの把握に強み
  • 🏥 医療の質評価:施設間アウトカム比較により、診療品質のばらつきを可視化できる
  • 🧭 診療ガイドライン改訂への貢献:RWEが蓄積されることで、現行ガイドラインのエビデンスを補完・更新できる
  • 💰 医療経済評価(費用対効果):RWDを用いた費用効果分析は、日本の費用対効果評価制度(2019年〜保険収載)への活用が進む


RWEの信頼性を担保するためには、STRATEGUSやSTROBE、PCORNETなどの国際的な報告基準への準拠が求められます。論文執筆の際はこれらのチェックリストを事前に確認しておくと、投稿後の修正作業を大幅に減らせます。


医療従事者一人ひとりが日常診療で入力するデータが、将来の医療エビデンスを形成するという意識を持つことが、質の高いRWD蓄積への第一歩です。これはRWD研究に直接関わらない方にも関係することです。


STROBEガイドラインの日本語解説はこちらが参考になります。
EQUATOR Network|STROBE Statement(観察研究の報告基準)






実験医学 Vol.39No.11(2021-7) 〈特集〉がん代謝の新経路/医療リアルワールドデータ