実はSF-36を「全疾患に使える万能ツール」と思って使い続けると、疾患特異的な変化を見逃し治療効果の判定を誤るリスクがあります。
QOL(Quality of Life、生活の質)評価とは、疾患や治療が患者の日常生活・精神状態・社会的機能にどのような影響を与えているかを数値化・可視化するための手法です。単に「痛みがあるか」「歩けるか」という身体機能の話だけではなく、患者が自分の生活をどのように感じているかという主観的な視点を含む点が重要です。
つまり、QOL評価は患者中心の医療を実現するためのツールです。
医療従事者がQOL評価を活用する場面は大きく3つあります。1つ目は治療効果の判定、2つ目は意思決定支援(インフォームドコンセント)、3つ目は臨床研究・エビデンス構築です。日常診療においても、特に慢性疾患・がん・リハビリテーション領域では欠かせない指標になっています。
QOL評価ツールは大きく「包括的尺度(generic measure)」と「疾患特異的尺度(disease-specific measure)」の2種類に分類されます。包括的尺度は疾患を問わず幅広く使えますが、特定の疾患の細かな変化を捉えにくいという弱点があります。疾患特異的尺度はその逆で、対象疾患の微細な変化を鋭敏に検出できますが、他疾患との比較には向きません。
この分類が基本です。
日本でも広く使用されているツールの数は20種類以上に上り、目的に応じた選択が求められます。「なんとなく知っている名前のツールを使う」という習慣は、評価の信頼性を損なう原因になります。次のセクションから、それぞれのツールを一覧で整理していきます。
包括的QOL評価ツールのなかで最も広く使われているのがSF-36(MOS 36-Item Short-Form Health Survey)です。身体機能・日常役割(身体)・体の痛み・全体的健康感・活力・社会生活機能・日常役割(精神)・心の健康という8つのサブスケールで構成されており、合計36項目の質問から成ります。
SF-36は信頼性と妥当性が高く、国際的な比較研究にも多用されています。
日本語版も標準化されており、iHope International社が管理・頒布しています。使用には申請と費用が必要で、商用利用の場合は1回あたり数万円規模のライセンス料が発生することもあります。「無料で使える」と思い込んで申請なしに使用するケースが現場では散見されますが、これは著作権違反にあたるため注意が必要です。
EQ-5D(EuroQol 5-Dimension)は、移動・自己管理・ふだんの活動・痛み/不快感・不安/ふさぎ込みの5領域を1〜3段階(または1〜5段階)で評価するシンプルなツールです。回答に要する時間は約2〜3分と短く、高齢者や体力の落ちた患者への負担が小さいのが特徴です。また、VAS(視覚的アナログスケール)を併用して全体的な健康状態を0〜100点で表現することもできます。
EQ-5Dは健康効用値(utility score)の算出に使える唯一の包括的ツールとして、医療経済評価(費用対効果分析)においても標準的に採用されています。日本の中医協(中央社会保険医療協議会)が費用対効果評価に用いる指標としてもEQ-5Dが指定されており、新薬承認プロセスとも無関係ではありません。
WHOQOL(World Health Organization Quality of Life)は、WHOが開発した国際的なQOL尺度です。身体的・心理的・社会的関係・環境という4つの領域で構成され、WHOQOL-100(100項目)と簡易版のWHOQOL-BREF(26項目)があります。文化的背景の違いを超えた国際比較研究に強みがあります。
以下に3つの包括的尺度を比較した表を示します。
| ツール名 | 項目数 | 所要時間 | 主な用途 | 日本語版 |
|---|---|---|---|---|
| SF-36 | 36項目 | 約10〜15分 | 包括的健康状態・治療比較 | あり(有償) |
| EQ-5D-5L | 5項目+VAS | 約2〜3分 | 医療経済評価・健康効用値 | あり(有償) |
| WHOQOL-BREF | 26項目 | 約5〜10分 | 国際比較・多領域評価 | あり(無償利用可) |
疾患特異的QOL評価ツールは、特定の疾患群に特化した細やかな評価ができる点が最大の強みです。代表的なものを以下に整理します。
FACT-G(Functional Assessment of Cancer Therapy - General)はがん患者向けの包括的QOL尺度で、身体的・社会的/家族的・感情的・機能的の4領域・27項目から成ります。がん種ごとのサブスケール(FACT-B:乳がん、FACT-L:肺がん、FACT-P:前立腺がんなど)が用意されており、モジュール形式で拡張できる柔軟な設計が特徴です。これは便利ですね。
CAT(COPD Assessment Test)はCOPD(慢性閉塞性肺疾患)患者向けの8項目の簡易尺度です。スコアは0〜40点で、10点以上で生活への中程度以上の影響があると判断されます。回答が約1〜2分で完了するため、外来診療での定期モニタリングに非常に適しています。
KOOS(Knee injury and Osteoarthritis Outcome Score)は変形性膝関節症や膝関節障害の患者向けで、痛み・症状・日常生活機能・スポーツ/娯楽・QOLの5サブスケール42項目で構成されています。整形外科リハビリテーション領域での使用頻度が高い尺度です。
その他、心疾患領域ではMLHFQ(Minnesota Living with Heart Failure Questionnaire)が慢性心不全患者に広く使用され、腎疾患領域ではKDQOL-SF(Kidney Disease Quality of Life Short Form)が透析患者の評価に活用されています。
疾患特異的尺度が基本です。対象疾患が明確な臨床現場では、包括的尺度と組み合わせることで評価の精度が大幅に上がります。包括的尺度で全体像を把握し、疾患特異的尺度で細部を捉えるという二段構えの戦略が推奨されています。
どのQOL評価ツールを使うかは、「誰を対象に」「何を測りたいか」「どんな場面で使うか」の3点によって決まります。医療従事者がQOL評価の一覧を眺めて迷ってしまう最大の原因は、この3点の整理ができていないことです。
まず対象患者の視点では、以下のように整理できます。
次に測定目的の観点では、「医療経済評価(QALY算出)」を目的とするならEQ-5D一択といえます。費用対効果分析では健康効用値が必要であり、EQ-5D以外の尺度から効用値を算出するには変換アルゴリズムの適用が必要になるため、最初からEQ-5Dを使うのが効率的です。
臨床試験・エビデンス構築が目的であれば、すでに採用実績の多いSF-36やEORTC QLQ-C30を選ぶと既存データとの比較がしやすく、論文採択率も上がります。
回答負担の観点も無視できません。高齢患者・重症患者・認知機能の低下した患者には、項目数が少なく回答しやすいツールが適しています。具体的にはEQ-5D(5項目)やCAT(8項目)が候補になります。SF-36は36項目あるため、状態が悪い患者には完答率が下がるリスクがあります。
また、測定のタイミングも重要です。治療介入前後の変化を比較するには「反応性(responsiveness)」の高い尺度を選ぶ必要があります。反応性が低いツールを使うと、実際に改善が起きていても数値に反映されず「効果なし」という誤った結論を導く恐れがあります。
| 目的・領域 | 推奨ツール | 項目数 | 備考 |
|---|---|---|---|
| 医療経済評価(QALY) | EQ-5D-5L | 5項目 | 健康効用値算出に必須 |
| がん臨床試験 | EORTC QLQ-C30 | 30項目 | 疾患モジュール併用推奨 |
| COPD外来管理 | CAT | 8項目 | 毎回の外来で使用可能 |
| 全疾患比較・研究 | SF-36 | 36項目 | 規範値データが充実 |
| 小児患者 | PedsQL | 23〜45項目 | 年齢別バージョンあり |
QOL評価ツールの一覧を把握しても、実際の臨床現場での運用には落とし穴があります。ここでは特に見落とされやすい3つのポイントを解説します。
落とし穴①:言語版・日本語版の信頼性確認の欠如
QOL評価ツールの多くは英語原版を日本語に翻訳したものです。翻訳版が科学的に検証(信頼性・妥当性の検討)されているかどうかは、ツールによって大きく異なります。検証されていない非公式の日本語版を使用すると、得られたデータが研究・論文・診療記録として意味をなさない可能性があります。
使用前に必ず公式の日本語版かどうかを確認することが条件です。
例えばSF-36の日本語版は福原俊一先生らの研究グループによって厳密に標準化されており、使用許諾もiHope Internationalを通じて正式に取得する必要があります。一方、ネット上で見つけた無許諾のPDFを「とりあえず使う」という実態が一部の現場で見られますが、これはデータの信頼性を著しく損ないます。
落とし穴②:回答方法の変更による比較不能
同じツールでも、「紙による自記式」「面接形式」「電子デバイス(ePRO)」によって回答傾向が異なることが複数の研究で示されています。介入前と介入後で回答方法を変えてしまうと、変化の原因がツールの影響か治療の効果かが区別できなくなります。
これは意外ですね。評価方法の統一は必須です。
特に最近はタブレットやスマートフォンを使ったePRO(electronic Patient-Reported Outcomes)の導入が進んでいますが、既存の紙媒体データと比較したい場合は同等性検証が別途必要です。
落とし穴③:床効果・天井効果への無頓着
床効果(floor effect)とは、評価対象の患者集団のスコアが下限値に集中してしまい、それ以上の悪化を検出できない現象です。天井効果(ceiling effect)はその逆で、上限値に集中して改善が検出できなくなります。
たとえばEQ-5Dは重症患者集団では床効果が起きやすく、「すでに最低スコア」の状態の患者には使いにくいことがあります。このような場合には、より広い測定範囲を持つSF-36やEORTC QLQ-C30と組み合わせることが有効です。
QOL評価は「入れればいい」ではありません。ツールの特性と患者集団の特性を照合した上で選択・運用することが、信頼性のある評価データ収集の前提です。臨床現場での運用マニュアルとして、日本医療機能評価機構が公開している「患者報告アウトカム(PRO)活用ガイド」も参照価値が高いリソースです。
以下は、QOL評価ツールの標準化・使用許諾に関する情報が掲載されている信頼性の高い参考リンクです。
SF-36日本語版の使用申請・信頼性データについて詳細が確認できる公式サイトです。
iHope International(SF-36日本語版管理機関)
EQ-5Dの使用申請・日本語版の取得・費用についての公式情報が掲載されています。
EuroQol公式サイト(EQ-5D使用申請・ライセンス)
EORTC QLQ-C30の日本語版ダウンロード・使用条件に関する情報が掲載されています。