信頼性の高い情報を見極める方法。オックスフォード大学CEBM公表のエビデンスレベル
エビデンスレベルとは?
このブログでも多数の論文を紹介していますが、研究の仕方によって、得られる結果の信頼度には大きな差があります。そのように説明すると、信頼度の高い結果だけを厳選して情報配信すれば良いのでは? と思われるかもしれません。確かにそれも一理ありますが、それでは内容が堅苦しくなってしまいます。そこで、現段階で信頼度が高いとは言えなくとも、新規性のある研究や面白い視点を持った研究、今後に期待できそうな研究もエントリしています。
では、実生活で科学の知見を活かすには、どのような研究を信頼すれば良いのでしょうか? その点については、オックスフォード大学 Centre for Evidence-Based Medicine(CEBM)が公表している、エビデンスレベル(研究の信頼度)に関するガイドライン[1]が参考になります。エビデンスレベルは、図1のように「どれだけバイアス(偏り)を減らして研究されたか」という観点から科学的根拠のランク分けをしたものです。
[図1] エビデンスレベル
それでは信頼度が高い順に研究方法を紹介していきます。
信頼度 1a: ランダム化比較試験(RCT)の系統的レビュー
ランダム化比較試験(RCT)の系統的レビューとは?
ランダム化比較試験(RCT)の系統的レビューとは、図2のように個々のランダム化比較試験(1b)を統合してより高精度な結論を導く研究手法です。ランダム化比較試験(1b)については次の項目を参照してください。
- 特定の問いに対してランダム化比較試験(1b)の論文を可能な限り集める
- 研究デザインをチェックし、信頼できる論文データのみを抽出する
- 抽出したランダム化比較試験(1b)のデータを統合して再分析(メタ分析)する
[図2] ランダム化比較試験(RCT)の系統的レビュー
特徴
複数のランダム化比較試験(1b)の結果を総合的に確認できるため、より信頼度が高い結論を得られます。最も信頼度が高い研究手法です。
懸念点
研究者にとって都合の悪い結果は、そもそも論文として公表されていない可能性があります。このため、論文の抽出条件によってはバイアスが入る可能性も否定できません。
信頼度 1b: ランダム化比較試験(RCT)
ランダム化比較試験(RCT)とは?
ランダム化比較試験(RCT)とは、図3のように調査対象(例えばサプリメント)の効果を客観的に調べる研究手法です。
- 実験参加者をランダムに2つのグループ(実験群と統制群)に分ける
- 実験群には介入する(サプリメントを渡す)
- 統制群には介入しない(偽薬を渡す)
- 実験群の結果と統制群の結果の差が調査対象(サプリメント)の効果であると判断する
[図3] ランダム化比較試験(RCT)
特徴
ランダムに2グループに分けることで調査対象(サプリメントと偽薬)以外の差はなく、信頼度の高い結果が得られます。
懸念点
実験参加者の属性(遺伝的体質、食文化や環境など)によっては、必ずしも同じ結果が得られるとは限らず、後になって系統的レビュー(1a)で否定されてしまうことも多々あります。
信頼度 1c: All-or-none研究
All-or-none研究とは?
All-or-none研究とは、以下のような研究報告です。
- ある治療導入前はすべての患者が死亡していたが、導入後に患者が死亡しなくなった治療法
- ある治療導入前は死亡する患者もいたが、導入後はすべての患者が生存している治療法
信頼度 2a: コホート研究の系統的レビュー
コホート研究の系統的レビューとは?
コホート研究の系統的レビューとは、図4のように個々のコホート研究(2b)を統合して、より高精度な結果を導く研究手法です。コホート研究(2b)については次の項目を参照してください。
- 特定の問いに対してコホート研究(2b)の論文を可能な限り集める
- 研究デザインをチェックし、信頼できる論文データのみ抽出する
- 抽出したコホート研究(2b)のデータを再分析する
(全体として何が言えるのか、他の解釈可能性を検討する)
[図4] コホート研究の系統的レビュー
特徴
複数のコホート研究(2b)の結果を総合的に確認できるため、より信頼度が高い結論を得られます。また、倫理的にランダム化比較試験(1b)を実施できない研究(例えば、手術後の経過観察)などにおいては最も信頼度が高い研究手法といえます。
懸念点
研究者にとって都合の悪い結果は、そもそも論文として公表されていない可能性があります。このため、論文の抽出条件によってはバイアスが入る可能性も否定できません。
信頼度 2b: コホート研究
コホート研究とは?
コホート研究とは、図5のように実験参加者の追跡調査を行い、要因と発生率などの因果関係を特定することを目的とする研究手法です。
- 特定属性(例えば喫煙者&高血圧)をもつ実験参加者を集める
- 一定期間経過したあとで、属性変化(継続して喫煙した、禁煙した)に応じてグループ分けする
- 測定結果を比較することで、要因と発生率などの因果関係(喫煙と血圧の因果関係)を特定する
[図5] コホート研究
特徴
因果関係の特定を目的とした研究手法であり、例えば疾患発症に関するリスク要因を検討することなどに使われます。
懸念点
例えば、自発的に禁煙する人は、他にも健康的な食生活にするなどしている可能性があり、他の要因が結果に影響した可能性(交絡バイアス)を否定できません。また、発症例が少ない疾患などはグループ分け時に数の偏りが出てしまうため、後述のケースコントロール研究(3b)に頼ることになります。
信頼度 2c: アウトカム研究、生態学的研究
アウトカム研究、生態学的研究とは?
生態学的研究とは、集団を基本単位とした研究です。例えば、以下のような内容です。
- 別々の地域で共通する傾向がみられるか
- 1つの地域での時間変化によって傾向の変化がみられるか
特徴
観察する集団は国、都道府県、市町村といった集団であり、集団間の相関を検討することができます。
懸念点
生態学的誤謬(集団レベルで言えることが、個人レベルでは当てはまらないこと)があり、誤った推論をしてしまう可能性があります。
信頼度 3a: ケースコントロール研究の系統的レビュー
ケースコントロール研究の系統的レビューとは?
ケースコントロール研究の系統的レビューとは、図6のように個々のケースコントロール研究(3b)を統合して、より高精度な結果を導く研究手法です。ケースコントロール研究(3b)については次の項目を参照してください。
- 特定の問いに対してケースコントロール研究(3b)の論文を可能な限り集める
- 研究デザインをチェックし、信頼できる論文データのみ抽出する
- 抽出したケースコントロール研究(3b)のデータを再分析する
(全体として何が言えるのか、他の解釈可能性を検討する)
[図6] ケースコントロール研究の系統的レビュー
特徴
複数のケースコントロール研究(3b)の結果を総合的に確認できるため、より信頼度が高い結果を得られます。
懸念点
研究者にとって都合の悪い結果は、そもそも論文として公開されていない可能性があります。このため、論文の抽出条件によってはバイアスが入る可能性も否定できません。
信頼度 3b: ケースコントロール研究
ケースコントロール研究とは?
ケースコントロール研究とは、図7のように実験参加者の記憶を頼りに、現在発生している効果(例えば高血圧)の要因を特定することを目的とする研究手法です。
- ある効果(例えば高血圧)が出た参加者を集める(高血圧グループ)
- ある効果が出たグループの参加者と属性(年齢、性別など)が似ていて、効果が出ていない参加者を集める(血圧正常グループ)
- 2グループの過去の行動を実験参加者の記憶を頼りに調査し比較することで、特定因子(喫煙)を探る
[図7] ケースコントロール研究
特徴
発症例の少ない疾患などはランダム化比較試験(1b)やコホート研究(2b)を実施できないため、これらを対象とする研究に有効です。
懸念点
実験参加者の記憶の曖昧さなど様々なバイアスの影響を受けやすい。
信頼度 4 : 症例集積研究
症例集積研究とは?
症例集積研究とは、図8のようにある治療法を患者群に用いて治療経過や結果を観察し、その患者群の特徴をまとめた研究報告のことです。統制群(ある治療法を適用しない群)との比較はしないため、確認された結果が他の要因に影響されていないとは言い切れず、あくまでも患者群の現状を調べることを目的とした研究手法です。
[図8] 症例集積研究
信頼度 5 : 専門家の意見
専門家の意見とは?
生物学や基礎実験、自然科学の第一原理に基づいた専門家の意見です。専門家といえど、上述してきたような研究を基にした話でないと信頼度は低いです。参考程度に聞くのが良いでしょう。自分が実践するのであれば、少なくともRCTで効果が確認されていることは確認したいところです。
番外: 個人の体験談
個人の体験談とは?
これはCEBMのガイドラインに基づいたものではありませんが、よく言われるので書いておきます。個人の体験談は科学的根拠にはなりません。例えば以下のような主張。
- 糖質制限ダイエットが一番効率的。私が証明だ。
彼ら自身がその方法でやったということは事実でしょうから1つの意見としては尊重します。しかしながら、個人の体験談は全く科学的根拠に基づいたものではなく、その信頼度は著しく低いと言わざるを得ません。このブログでも、個人が実施した体験談などを載せていますが、そういったものも信頼度は「番外」になります。個人の体験談はバイアスが入る余地が多々あるので、信頼度も低くて当然ですね。
参考までに、例示した糖質制限ダイエットに関しては「糖質制限食は効果あるって言われているけど本当?」みたいな研究がありまして、結果は以下の通りになっています。
等カロリーの糖質制限食とバランス食の間には、減量効果および心疾患の発症率の差はほとんど見られなかった。
つまり、糖質の量は減量とは関係がなさそうということです。おそらく例示の主張者さんの場合は、糖質制限食にしたことによって、結果的に摂取カロリーが減り、減量に至ったという可能性が高そうですね。
エビデンスレベルのまとめ
信頼度順に簡潔にまとめておくと以下のようになります。実生活に役立てるときの参考にしてみてください。
- 信頼度 1a: ランダム化比較試験(RCT)の系統的レビュー
- 信頼度 1b: ランダム化比較試験(RCT)
- 信頼度 1c: All-or-none研究
- 信頼度 2a: コホート研究の系統的レビュー
- 信頼度 2b: コホート研究
- 信頼度 2c: アウトカム研究、生態学的研究
- 信頼度 3a: ケースコントロール研究の系統的レビュー
- 信頼度 3b: ケースコントロール研究
- 信頼度 4 : 症例集積研究
- 信頼度 5 : 専門家の意見
- 番外 : 個人の体験談
こちらの記事も参考にしてみてください。