患者満足度調査の落とし穴

-文献名-
Jhon W.Bachman. The Problem With Patient Satisfaction Scores. Fam Pract Manag. 2016 Jan-Feb;23(1):23-27

-この文献を選んだ背景-
 患者満足度の一つであるJPCATは、一つのクリニックについて、プライマリ・ケアの主要な機能を満足度に似た形で測定するツールである。我々はグループ診療であるため、特に医師に関する調査項目は医師全体としての評価と捉えられるが、日本の診療所は一般的にはソロプラクティスが多く、もし一般開業医がJPCATを実施すれば、それは医師に対する直接的な評価となりうる。海外では医師ひとりひとりに対する満足度調査が徐々に広まっている。それについて読んでみた。

-要約-
<要点>
1.適切なサンプルから得たすべての医師の総合データが、有意義な変革を可能にする。問題を引きおこしているプロセスを同定し、介入し、その介入に効果があるかみていく
2.誤差と分析手法といった統計学的な情報が含まれなければ、満足度は発表しない。(すなわち、個人やグループの点数と全体の平均の違いがいかに重要かということである)
3.正確な満足度を出すためには困難と費用がかかるが、医師個人の満足度をベースにした報酬制度やペナルティは行ってはいけない。医師は不十分なデータに基づいて診療をすべきではないし、医師の給料はそれによって決められてはいけない。
4.いわゆる外れ値である、数は少ないが最低値の患者満足度を精査すること。それだけ低い点数の医師はバーンアウトの危険性があるが、注意すべき特別な環境因子がある可能性がある。
5.質改善と統計学的多様性について学びなさい。大きい組織では、すべての結果の85%が組織のシステムに関係しており、残りの15%が人に関係している。焼き過ぎたトーストの焦げを落とす良い方法を考えるより、トースターを直す方法を学びなさい。

<背景>
 医師一人ひとりについての患者満足度がだんだんと普及してきた。
 患者満足度はここ数年でさらに注目されてきた。患者中心のケアが強調されてきたからだけでなく、小グループあるいは大規模な組織に所属することが多くなってきたからである。大きな組織は、彼らの診療のあらゆる点についてシステマティックに患者満足度を調査している。集計された結果をもちいて、他の医師や組織や、一般的な基準と比較することができるようになった。
 近年患者満足度のインパクトは強くなっている。そのため正確な集計や結果の適応が重要となっている。ひとたび患者満足度がネット上に出ると、医師の評判はその影響を受ける。幾つかの診療所では、トレーニングや経営上の改善が必要な医師を見極めるために満足度を利用している。
 正当な患者満足度は確かにケアやサービスの質を改善するかもしれない。しかしそれは医師自身の満足度を減らすといった予想もしていなかった結果を招く可能性がある。ある研究では、78%の医師が、患者満足度は仕事の満足度に、中等度から強度のネガティブな影響を与えることがわかった。さらに28%の医師は、患者満足度によって退職を考えたことがあると答えた。

<サンプリングの問題>
 患者満足度の潜在的な問題を理解するために、まずデータがどのように集められ、どのように集計され、どのような影響があるか理解することから始める。
 患者満足度は、普通複数の異なる方法で作成・管理された調査から得られる。質問がどういうふうに、どんなときに尋ねられたかは結果に影響を与える。
たとえば電話調査は、記載調査とは異なる結果になる傾向がある。また診察後の調査と、診察後数週間後の調査でも得られる情報は変わってくる。
 多くの調査は一つの地域についての一連の質問で構成されている。例えば典型的な患者満足度調査は、医師とのやり取りについて13の質問からなり、各質問に5つの選択肢がある形式だ。「医師はたいていよくやっている」、などバリエーションは限られている。ミネソタやその近郊の一部の地域では、79%の患者が10点中9〜10点をつけている。高得点に固まっていると、個別の医師の点数と全体の点数を比較する時、少数の不満を持つ患者が重大なインパクトをもつことになる。もし担当患者の数が異なったら、満足度はミスリードされてしまう。患者満足度は普通パーセンテージで表わされるので、サンプルサイズの違いはすぐにはわからないのだ。
 また回答者の数が異なる調査で得られた満足度同士を比較すると同様の問題がおこる。回答者が少なくなればなるほど、満足度は高く、あるいは低くなる傾向がある。データの数が少ないと、非常に良い評価や非常に悪い評価の影響が反映されやすくなるためだ。回答者が多くなるほど、そして患者経験が多岐にわたるほど満足度は平均に近づく、これは質の問題ではなく、統計学的な作用の問題である。
 サンプルサイズは正確性にも影響を与える。調査というのは95%信頼区間と5%の誤差があるものである。もし私達が誰かのコンピテンシーを評価するときは、95%信頼するのが妥当だ。20回に1回間違いがあるのでは、正確に評価されないのではという不安をもたらす。対象患者の数が少なければ少なくなるほど、誤差はたいてい小さく見積もられ、スコアは大きくなる。調査の信頼度を上げるためには、より大きなサンプルサイズが必要だが、その調査の費用はかさみ、典型的には医師一人ひとりの患者満足度を評価するためには実施されない。
 正確な比較を行うためには、サンプルサイズと調査方法は同じでなければならない。あなたがある程度の結果を得るまでいくつかの調査を実施し、積極的にフォローアップすると、ある一つの結果を得ることになる。十分なパーセンテージになるように期待しつつたくさんの調査を実施すると、別の結果を得る。後者はサンプルがランダムでは無くなったり、回答者を選んでしまったりするからだ。

<多様性が大きくなると、満足度調査の信頼性が下がる>
 患者満足度は、医師のパフォーマンスに関係のない幾つかの要因の多様性に影響を受け、そのため評価と比較が難しくなっている。

人:点数を高くつける患者のキャラクターについては今までで研究されてきた。つまり、高齢患者、医療者が女性、医療的結果が良好な時、より重病なとき、より医療コストが掛かった時などにスコアは上がることがわかっている。
 また他の要因は比較するときに影響を与える。たとえば新規開業した医師は、もともと開業している医師とは異なる患者の期待や要求に直面する。時間をかけて医師患者関係が発展してきた医師よりも、difficult patient interactionの経験や、drug-seeking患者の診療が起きやすくなっているかもしれない。
 医師は毎日無数の形で患者と相互に影響しあっている。中には満足度調査の内容に含まれる患者経験を阻害するようなものもあるかもしれない。例えば医師と電話やメールでやり取りした患者は、実際診療所で診察を受けた患者よりも、満足度調査の際対象として除外されやすい。
 さらに、調査は患者とのやり取りの本当の質を実際には測定していないかもしれない。医師が最高の質のケアを提供していなくても、最高の患者満足度を得るかもしれないし逆もまたあり得る。ある研究で、記載型の調査を終えた患者にインタビューをした時、彼らが受けたケアと点数付けの間にときどきかなりの差があることがわかっている。

システム:医師はシステムの中で仕事をしている。そのシステムは患者満足度に影響を与えるうるが、医師のコントロールの及ばないものもある。たとえば患者のアクセスの問題、長い受診間隔、予約をとる困難さなどである。システムに必要なのは、患者にネガティブな影響を与えうる過労、混雑する受診、電子カルテの複雑さ、必要な書類が多すぎることの助けになることである。

解釈:どんなプロセスでも結果の解釈について、私たちは様々な解釈をすることになる。そしてしばしばその解釈は間違っている。たとえば完全にランダムなスコアのカルテや主題のコントロールを超えたタスクの結果についての研究は、観察者はそこにない、歪んだ解釈を探すことがわかっている。その他満足度の弱点として、時間経過の一時点のみを反映していることもある。もし同じ調査を繰り返したら、その結果は予想ができない。

環境:医師が働いているセッティングによって患者のポピュレーションやミッションは大きく異なる。たとえば3次医療センターvsプライマリ・ケアセンター。これらの医師の患者満足度の比較は慎重にしなければならない。

<改善は現実的なのか?>
 患者の満足度の測定は安くない。調査の実施と集計は高価であり、正確な調査を求めるとコストだけがあがっていく。幾つかの組織は外部に委託している。それは結果の独立性が明らかだし、組織の満足度をトップ10に入れ競争的優位にたてるように改善させる戦略を提供してくれるからである。しかし患者満足度の測定と結果に基づくより良いパフォーマンスは実行されているのか?
 最近行われたオタワ足関節ルールの使用に関する会議で、ある医師が「患者の満足度は、レントゲン検査をオーダーすると高くなる」と発言した。金銭的なインセンティブは注意が必要だがすべきである。安定したシステムの中では平均への回帰、つまり最高値、最低値は徐々に平均に引き寄せられる。しかし実際のパフォーマンスは改善しない。
 患者満足度を改善させるもっともよいアプローチは、介入を考案することである。そしてそれを組織に適応し、介入が悪いパフォーマンスにだけでなく、システム全体を改善するかを見ることである。このアプローチは、公式目標と、組織の患者対応の改革案に関わるだろう。監査でなく、改善がプロセスの質の改善のキーなのだ。

<それで何をする?>
 以下を組織に問うことで、医師は患者満足度の潜在的問題を軽減させ、誤ったプロセスがあったとしてもそこから組織が最高のベネフィットを生み出せるだろう。

1.適切なサンプルから得たすべての医師の総合データが、有意義な変革を可能にする。問題を引きおこしているプロセスを同定し、介入し、その介入に効果があるかみていく
2.誤差と分析手法といった統計学的な情報が含まれなければ、満足度は発表しない。(すなはち、個人やグループの点数と全体の平均の違いがいかに重要かということである)
3.正確な満足度を出すためには困難と費用がかかるが、医師個人の満足度をベースにした報酬やペナルティは行ってはいけない。医師は貧弱なデータに基づいて診療をすべきではないし、医師の給料はそれによって決められてはいけない。
4.外れ値である、数は少ないが最低値の患者満足度を精査すること。それだけ低い点数の医師はバーンアウトの危険性があるが、注意すべき特別な環境因子がある可能性がある。
5.質改善と統計学的多様性について学びなさい。大きい組織では、すべての結果の85%が組織のシステムに関係しており、残りの15%が人に関係している。焼き過ぎたトーストの焦げを落とす良い方法を考えるより、トースターを直す方法を学びなさい。

【開催日】
 2016年8月17日(水)