RWDを使えば研究倫理審査が不要だと思っていると、研究計画ごと白紙になります。
リアルワールドデータ(RWD)とは、日常の臨床現場で生成・収集されるあらゆる健康関連データの総称です。具体的には、電子カルテ(EMR/EHR)、レセプトデータ、疾患レジストリ、医療機器からの測定値、さらには患者報告アウトカム(PRO)などが含まれます。
RCT(ランダム化比較試験)が厳密な条件設定のもとで行われるのに対し、RWDは制限のない実臨床環境から得られる点が大きな違いです。つまり、RCTの「理想の世界」に対してRWDは「現実の世界」のデータといえます。
日本では、厚生労働省が2019年に「リアルワールドデータの利活用に向けた基盤整備」を推進し始め、MID-NET(医療情報データベース基盤整備事業)が約400万人規模のデータを保有するまでに成長しました。医薬品の製造販売後調査にも活用されており、承認後の安全性・有効性評価に欠かせない存在になっています。
これが基本です。
RWDから生成されたエビデンスは「リアルワールドエビデンス(RWE)」と呼ばれ、規制当局への申請資料にも使われるケースが増えています。FDAは2018年に「Real-World Evidence Framework」を発表し、医薬品承認へのRWE活用を正式に認める方針を示しました。日本のPMDAも同様の検討を進めており、医療従事者にとってRWDへの理解は今後ますます重要になります。
RWDを使った臨床研究で最も頭を悩ませるのが、交絡因子(Confounding factor)の存在です。RCTではランダム割り付けによって交絡を排除できますが、観察研究であるRWD研究では処置群と対照群の背景が不均一になりがちです。
交絡因子とは何でしょうか?
たとえば「A薬を投与された患者は死亡率が低い」というデータがあっても、A薬が処方される患者はもともと病態が軽い場合があります。この「病態の軽さ」が交絡因子となり、薬の真の効果を過大評価してしまいます。これをバイアスといいます。
この問題を解決する代表的な手法が傾向スコア解析(Propensity Score Analysis)です。傾向スコアとは「ある患者が特定の治療を受ける確率」を共変量から推定したスコアで、このスコアでマッチングやIPW(逆確率重み付け)を行うことで、疑似的なランダム割り付けに近い状態を作り出せます。
研究デザインの段階からバイオ統計家を巻き込むことが原則です。後から「統計が合わない」と気づいても、収集済みデータでは対処できない場合があります。特に後ろ向きコホート研究では、測定されていない交絡因子(未測定交絡)が常に問題になることを念頭に置いておきましょう。
参考として、傾向スコア解析の実装についてはRやSASのパッケージが充実しており、日本では「MatchIt」パッケージ(R言語)が広く使われています。
RWDを二次利用する臨床研究でも、倫理審査は原則として必要です。これは見落としやすい点なので注意が必要です。
2021年に全面改正された「人を対象とする生命科学・医学系研究に関する倫理指針(生命・医学系指針)」では、既存試料・情報のみを使う研究であっても、機関の長の許可と倫理審査委員会への申請が基本とされています。「カルテデータを使うだけだから審査不要」という判断は誤りです。
ただし例外もあります。
匿名加工情報を使用し、かつ研究対象者への侵襲や介入を伴わない場合には、倫理審査委員会への届出のみで実施できるケースがあります(指針第13条)。ただし「匿名加工」の定義は厳格で、氏名・生年月日・住所・個人識別符号を除去するだけでなく、連結不可能な状態にする必要があります。
倫理審査の手続きを怠ると、論文投稿時に掲載拒否となるリスクがあります。国際誌ではICMJEガイドラインに従った倫理承認番号の記載が必須であり、承認なしの研究は査読の段階で却下されます。これは時間とコストの大きな損失です。
厚生労働省の生命・医学系指針本文および解説はこちらで確認できます。
厚生労働省|人を対象とする生命科学・医学系研究に関する倫理指針
日本にはRWD研究に活用できる公的データベースがいくつか整備されており、それぞれ特徴と申請手続きが異なります。
まず最も規模が大きいのがNDB(National Database:レセプト情報・特定健診等情報データベース)です。約1億人分のレセプトデータと特定健診データが収録されており、厚生労働省が管理しています。研究利用には「特別抽出申出」が必要で、申請から利用開始まで通常6〜12か月かかります。費用は申請内容によりますが、数十万円規模になることもあります。
次にMID-NET(Medical Information Database Network)はPMDAが運営し、協力医療機関の電子カルテ・レセプト・DPC情報を連結した約400万人規模のデータベースです。医薬品の安全対策や製造販売後調査での活用が主目的で、製薬企業や大学・研究機関が申請できます。
申請のポイントは研究計画の明確さです。「どの薬剤の、どの期間の、どのアウトカムを調べるか」を具体的に記載しないと差し戻しになります。また、データ利用に際してはセキュリティ要件(専用端末・閉じたネットワーク環境)が課せられるため、施設のICT部門との事前調整も必要です。
MID-NET利用申請の詳細はPMDA公式サイトで確認できます。
PMDA|MID-NET(医療情報データベース)の利用申請について
RWD研究において、検索上位の記事でほとんど触れられていない重要な落とし穴が「アウトカム定義の精度」です。これは独自視点から強調したいポイントです。
レセプトデータや電子カルテを使った研究では、アウトカム(結果指標)を「病名コード(ICD-10)」や「処方コード」で定義するのが一般的です。しかし、実臨床ではコーディングの精度が施設や医師によって大きくばらつきます。
どういうことでしょうか?
たとえば「急性心筋梗塞(AMI)」をICD-10コード「I21」で定義した場合、実際にはAMIではなく不安定狭心症や心不全がコードされているケースが混在することがあります。米国の研究では、レセプトベースのAMI定義の陽性適中率(PPV)は施設によって60〜95%と大きな幅があると報告されています。
この「ミスコーディング」が研究結果に与える影響は小さくありません。
バリデーション研究を省くと、論文の査読で「アウトカムの妥当性が示されていない」と指摘されるリスクが高まります。研究計画書の段階でバリデーション用のサブサンプル(通常100〜200例)を確保する設計にしておくことが、後悔しないための一手です。
また、アウトカム定義の精度問題はデータ取得元の質にも左右されます。DPCデータは診断精度が比較的高い一方、外来レセプトのみでは重症度情報が欠落しやすい点も覚えておきましょう。
RWDを正しく活用することで生み出されるリアルワールドエビデンス(RWE)は、今後の医療の意思決定を大きく変える可能性を持っています。
既に実例はあります。
日本では2020年頃から、COVID-19パンデミック対応においてレセプトデータや電子カルテデータの緊急分析が行われました。特定の基礎疾患を持つ患者群の重症化リスクを短期間で推定し、ワクチン優先接種の政策立案に役立てた事例はRWEの実力を証明しています。
また、希少疾患の治療薬承認においてもRWEの役割は増しています。RCTで十分な症例数が集められない希少疾患では、患者レジストリから得られたRWDが有効性・安全性のエビデンスとして規制当局に提出されるケースが世界的に増加中です。
RWEの信頼性を担保するためには、STRATEGUSやSTROBE、PCORNETなどの国際的な報告基準への準拠が求められます。論文執筆の際はこれらのチェックリストを事前に確認しておくと、投稿後の修正作業を大幅に減らせます。
医療従事者一人ひとりが日常診療で入力するデータが、将来の医療エビデンスを形成するという意識を持つことが、質の高いRWD蓄積への第一歩です。これはRWD研究に直接関わらない方にも関係することです。
STROBEガイドラインの日本語解説はこちらが参考になります。
EQUATOR Network|STROBE Statement(観察研究の報告基準)