Value-based Health Care niet geschikt voor GGZ

De discussie rond het initiatief van Menzis om over te gaan tot een soort ‘prognosevergoeding’ (ik kan er niet direct een beter woord voor vinden) bij depressie is nuttig in het blootleggen van de relatieve disconnect tussen de wetenschap die probeert rationele oplossingen te vinden voor complexe problemen, en bedrijfskundige concepten die zich voordoen als maakbare en meetbare oplossingen, maar niet meer zijn dan onzekere gammawetenschap-experimenten.

Menzis zegt met zoveel woorden: de kosten lopen de pan uit, dus resultaatvergoeding gaat de oplossing zijn. Echter waarom dat zo zou zijn is niet duidelijk, want het is niet wetenschappelijk aangetoond. Integendeel: pay-for-performance is bewezen niet effectief gebleken ten behoeve van kostenreductie dan wel kwaliteitsverhoging in de Verenigde Staten. Waarom zou Menzis iets willen pushen dat niet werkt?

Waarom zou Menzis iets willen pushen dat niet werkt?

Van mijn broer, econoom en lange tijd bankier, weet ik dat economie een gammawetenschap is, gelijk sociologie en antropologie, die soms gevoelig is voor nieuwe ideeën van goeroes. Zo’n goeroe kun je vaak inhuren voor een workshop om het bedrijf naar ‘the next level’ te krijgen. Goeroes inspireren mensen die zitten met taaie managerial processen en dagelijks onmacht ervaren, om een nieuwe weg naar sturing en controle in te slaan.

Een relatief nieuwe persoon, met goeroestatus, die veel invloed heeft onder gezondheidszorgeconomen, is Michael Porter van de Harvard Business School. Hij presenteerde het aansprekende maar uiteindelijk vage (zie onder andere de stukken van René ten Bos hierover in het Financieel Dagblad) idee van ‘value-based health care’ (VBHC). Zijn invloed is groot. Zo werd het VBHC-concept door de bestuurders van bijvoorbeeld Karolinska, Erasmus UMC en vier grote GGZ-instellingen geïnternaliseerd als een nieuwe oplossing voor complexe problemen. Echter om vervolgens niet zelden te stuiten op lastige en onwetende hulpverleners en patiënten, en – zoals in het geval van Karolinska – negatieve evaluaties.

Dus waar zit precies de disconnect? Wel, mijn vraag aan Menzis en de 4 grote GGZ-instellingen bij Volante zou zijn: is er niet iets meer over het onderwerp van de VBHC-geïnspireerde genezingsbonus cq prognosevergoeding te zeggen dan dat het goed is en dat het moet, met name als we iets verder kijken naar de details en de onderliggende complexiteit? En wat je hier wetenschappelijk, vanuit inconvenient science, over zou kunnen zeggen? Zoals:

  1. Het onderzoek naar psychische aandoeningen is niet minder actief en niet minder productief dan bij kanker en cardiologie. Er zijn duizenden behandeltrials voor psychische aandoeningen in de Cochrane library, meer dan op enig ander vakgebied. De grote kwestie bij psychische aandoeningen is dat het substraat – psychisch lijden – in essentie, ondanks heel veel onderzoek, nog steeds onbegrepen is. Omdat psychische klachten subjectief zijn valt er niets te meten in het fysische domein, zoals dat bij kanker en cardiologie wel kan. Er zijn vele medicamenten en psychotherapieën, maar hun effect is beperkt. Leren omgaan met een psychische kwetsbaarheid is een frustrerend, niet-lineair proces van jaren van weerbaarheidsbevordering in de klinische, sociale en vooral existentiële dimensie, dat vooral werkt via de relatie met een betrokken en vasthoudende hulpverlener. Een ROM-symptoomlijstje kan dit niet-lineaire relationele proces over de tijd niet meten – maar daarin zit wel de kwaliteit.
    Het is niet zo dat de sector zélf verantwoordelijk kan worden gehouden voor de nog zeer beperkte staat van harde wetenschap. Je kunt niet stellen dat de sector heeft nagelaten onderzoek te doen. Dus roepen om hardere indicatoren, hardere wetenschap, een duidelijke wetenschappelijke grondslag – het heeft allemaal geen zin.
    Dat roepen is wel een teken van deze tijd: niet kunnen/willen accepteren dat niet-weten, onvoorspelbaarheid en complexiteit van mensen onlosmakelijk zijn verbonden aan het probleem van psychisch lijden. Het lijkt endemisch. Maar toch: als de GGZ niet past in de lopende band van de VBHC-fabriek, is dat niet de schuld van de ‘achterlijke’ mensen die in de sector werken. Dat is blaming the victim. Het is helaas, wat is het woord: complex.
  2. Variatie in de uitkomst van een aandoening als depressie, als meest prevalente psychische aandoening, is voor het leeuwendeel terug te voeren op onbegrepen pathofysiologie en mechanismen die de behandelaar niet onder controle heeft. Dit is niet specifiek voor de GGZ – het borstkankermedicijn herceptin werkt maar bij 20 procent van de patiënten, en niemand weet waarom. Het heeft te maken met onbegrepen tumorbiologie.
    Bij depressie is het resultaat van de toepassing van een ‘evidence-based’ behandeling 60 procent. Niet slecht, en helaas begrijpen we niet waarom het maar 60 procent is. Het is in ieder geval nauwelijks terug te voeren op verschillen in kwaliteit tussen behandelaren. Wel is variatie in uitkomst van een aandoening als depressie terug te voeren op allerlei sociale factoren, zoals lage SES, schulden, sociale isolatie, werkeloosheid, vroege verwaarlozing, laaggeletterdheid, etc.
    Ook dit is niet specifiek voor de GGZ want het geldt voor vrijwel alle ziekten. Met andere woorden: anders dan bij staaroperatie en heupplastieken, waar de operateur vrij veel impact heeft op de variatie in de uitkomst van de operatie, is dit bij de GGZ-behandeling veel minder het geval. Het percentage van de uitkomstvariatie dat is terug te voeren op de behandelaar zelf is, net zoals bij herceptin en borstkander, gering. Wetenschappelijk gezien te gering om ‘resultaat’-vergoeding bij depressie zinvol te laten zijn. Of, om het nog duidelijker te stellen: net zo irrationeel als een genezingsbonus geven bij de 20 procent van de behandelingen waar herceptin wél een onbegrepen effect heeft op borstkanker. Dat is geen resultaatvergoeding maar een loterijvergoeding. Dus waarom wil Menzis iets doen wat irrationeel is?
  3. Er is een uitgebreide literatuur die gaat over hoe mensen, als er geld verdiend kan worden, hun gedrag en aanbod strategisch aan gaan passen om de inkomsten te maximaliseren. Selectie dus. Als er iets bewezen is, dan is het dat wel. Dus roepen dat risicoselectie geen issue gaat zijn, gaat in tegen de wetenschappelijke fundamenten van het vakgebied van de psychologie. Sterker, sinds de introductie van de marktwerking in 2006 is duidelijk geworden dat er in de GGZ groeiende overbehandeling is van lichte problematiek en onderbehandeling van ernstig psychisch lijden. De reden: risicoselectie.
    Bij ingewikkelde mensen met een combinatie van verslaving, psychose, suïcidaliteit, agressie, verstandelijke beperking, autisme en persoonlijkheidsstoornis is het moelijker om inkomsten te generen in het huidige systeem. Gevolg is dat gedwongen opnamen in de psychiatrie de afgelopen tien jaar met 80 procent zijn gestegen. Dus waarom de prognosevergoeding van Menzis niet zou gaan leiden tot selectie is onduidelijk.
  4. Een datakerkhof van ROM-symptoomlijstjes zegt – wetenschappelijk aantoonbaar – weinig tot niets over vergelijkende kwaliteit tussen instellingen. De Algemene Rekenkamer stelde al in 2017 dat de ROM-database van de Stichting Benchmark GGZ incompleet, onbetrouwbaar en onvergelijkbaar is – en dat dit soort data niet geschikt zijn om kwaliteitsmatig in te kopen. De verzamelde hoogleraren psychiatrie kwamen al in 2012 al tot dezelfde conclusie, op basis van wetenschappelijke argumenten die tot op heden niet weerlegd zijn. Bovendien zijn patiënten steeds minder bereid om allerlei vragenlijsten in te vullen op basis waarvan de verzekeraar zijn behandeling bij de instelling financieel meer of minder aantrekkelijk kan gaan maken. De levering van ROM-data aan de Stichting Benchmark ligt sinds vorig jaar dan ook grotendeels stil en het is onwaarschijnlijk dat patiënten en behandelaars bereid zullen zijn het circus ooit weer op te starten. Dus waar wil Menzis zijn data vandaan halen?
  5. Iets dat moeilijk is te begrijpen maar wetenschappelijk wel hard te maken is, is dat het verzamelen van ROM-data over symptoomreductie bij alle GGZ-patiënten in Nederland weliswaar theoretisch mogelijk is, maar statistisch gezien niet kan dienen om kwaliteitsvergelijkingen te produceren. Waarom niet? Omdat de verschillen in symptoomreductie tussen instelling X in Groningen en Instelling Y in Limburg principaal het gevolg zijn van sociaal-economische gezondheidsverschillen tussen de regio’s, waaruit een eventueel ‘echt’ kwaliteitsverschil tussen de instellingen in dit soort grove massa-databases niet meer gedestilleerd kan worden. Met andere woorden: de ‘case-mix’ correctie die organisaties die uitkomstdata verzamelen (DICA, SBG) zeggen toe te passen, zijn vrijwel altijd ineffectief, althans als je denkt dat je bezig bent met kwaliteitsvergelijkingen (Braithwaite, 2018). Het is boeiend om te zien hoeveel mensen zich op ideologische gronden blind houden voor dit gegeven.

OK – nu kunt u zegen: leuk dat je het afkraakt, maar heb je dan een oplossing voor de GGZ, met name voor het feit dat de GGZ onbetaalbaar dreigt te worden en er weinig inzicht is in kwaliteit?

Het antwoord is: Ja. Er zijn oplossingen bedacht die wel kunnen werken. We focussen hier op twee dingen:

  1. Creëer een functioneel kwaliteitskader voor de GGZ (Van Os & Delespaul, Tijdschrift voor Psychiatrie, 2018). De jaarprevalentie van psychische aandoeningen is 20 procent, maar de GGZ-sector heeft, bij ontbreken van een publieke GGZ, slechts capaciteit voor 6 procent. Er is geen regie over, of inzicht in, welk deel van de 20 procent potentiële vraag wordt geselecteerd voor verzekerde GGZ-zorg, met als gevolg ondoelmatige inzet van middelen.
    Wij stellen voor om te werken met een kwaliteitskader dat zich richt op de impact van de GGZ op de psychische gezondheid van de hele populatie – in plaats van onwetenschappelijk benchmarken van symptomen bij een – toenemend strategisch – geselecteerde groep, werkend vanuit een epidemiologisch en public health perspectief. Een belangrijke – maar onontgonnen – kwaliteitspijler wordt gevormd door regionale variatie in 22 kwantitatieve kernparameters op populatieniveau (patronen van psychische en somatische zorgconsumptie en ‘kruisverkeer’, farmaco-epidemiologische gegevens, indicatoren van arbeid en sociale zekerheid, mortaliteit, BOPZ, etc). Een andere pijler is een (simpel) systeem van onderlinge visitatie, gebaseerd op 10 kwaliteitsparameters die nu onzichtbaar blijven, bijvoorbeeld: principe van kleinschaligheid; toegankelijkheid; flexibele op- en afschaling van zorg; maatwerk bij complexe comorbiditeit; multideskundige personele bezetting; focus op community en relaties; beperking van administratieve lasten; aantoonbare experience-based co-design van zorg. Een valide kwaliteitskader kan, in combinatie met het instellen van een publieke GGZ, de huidige ondoelmatigheid en kwaliteitsblindheid opheffen.

    eCommunities kunnen worden gezien als de voorhoede van een nieuwe Publieke GGZ

  2. Creëer een publieke GGZ (Van Os, 2018). Significante psychische klachten zijn, met een jaarprevalentie van 20 procent, een gezondheidsprobleem van publieke omvang. De GGZ heeft capaciteit voor ten hoogste 6 procent van de populatie en komt in het bestel van de gereguleerde markt niet tot een goede afstemming tussen zorgbehoefte en zorgconsumptie op populatieniveau (i.e. onderbehandeling en overbehandeling). De noodzaak voor een Publieke GGZ, gericht op lange termijn weerbaarheidsbevordering, die opereert naast de DBC productie GGZ, gericht op korte termijn symptoomreductie, is alom erkend, maar heeft van overheidswege nog geen vorm gekregen.
    Nederland kent een beginnende Publieke GGZ in de vorm van een netwerk van zogenaamde ‘eCommunties’, elk met een eigen ‘look and feel’, zodat mensen een lage drempel ervaren om zich te verbinden met anderen met soortgelijke psychische problemen. Voorbeelden zijn Proud2bme.nl, PsychoseNet.nl, Drugsinfoteam.nl, Dwang.eu en Dementieweb.nl. Deze eCommunities zijn ‘multideskundige’ initiatieven die jaarlijks miljoenen bezoekers trekken en over heel Nederland mensen bijstaan in psychisch lijden en het navigeren van het complexe GGZ-landschap. eCommunities kunnen worden gezien als de voorhoede van een nieuwe Publieke GGZ. Een reservering van 0,08 procent in elke DBC die wordt afgesloten in de traditionele GGZ is voldoende om te voorzien in een duurzame Publieke GGZ in de vorm van 10 tot 15 eCommunities.
    Het lijkt me instructief als verzekeraars en wetenschappers meer met elkaar praten over oplossingen in de zorg. Natuurlijk moet die betaalbaar blijven en natuurlijk moet er inzicht zijn in kwaliteit. Maar graag wel op manieren die werken en het probleem niet erger maken.
1 – Van Os, J. (2018). ‘Multi-expert’ eCommunities as the basis of a novel system of Public Mental Health. Tijdschrift voor Gezondheidswetenschappen, 96, 62-67.
2 – Van Os, J., & Delespaul, P. (2018). Een Valide Kwaliteitskader Voor De GGZ: Van Benchmark-ROM Aan De Achterkant Naar Regionale Regie en Co-creatie Aan De Voorkant. Tijdschrift voor Psychiatrie, 60, 96-104.
3 – Delespaul, P., Milo, M., Schalken, F., Boevink, W., & Van Os, J. (2016). GOEDE GGZ! Nieuwe concepten, aangepaste taal, verbeterde organisatie. Amsterdam: Diagnosis Uitgevers.
4 – Braithwaite, R. S. (2018). Risk Adjustment for Quality Measures Is Neither Binary nor Mandatory. JAMA 319, 2077-2078.

Delen