Opkomst en ondergang van benchmarken in de ggz

Hier bespreek ik het verhaal van het waarschijnlijk meest ambitieuze plan ooit om het proces van psychisch lijden, en de pogingen van behandelaars om daar verlichting in te brengen, uit te drukken in kwantitatieve data ten behoeve van een financieel concurrentiesysteem van gezondheidszorg dat werd uitgevonden aan de Harvard Business School en bekend staat als het principe van Value-Based Health Care (VBHC). VBHC is onbewezen – en waar onderzocht niet effectief – maar desondanks officieel omarmd door de top van het ministerie van VWS en menig zorgverzekeraar en ‘zorgeconoom’.

Het experiment in de ggz begon rond 2011, was groots opgezet en had een nationale trots moeten worden. Het eindigde echter in 2019, 100 miljoen euro later, met de vernietiging van een psychische database met gegevens over de suïcidaliteit, verslaving, seksualiteit en paranoia van naar schatting 2 miljoen Nederlanders (cijfers hierover zijn nooit bekend gemaakt). De reflectie op dit waarschijnlijk grootste échec in de geschiedenis van de Nederlandse ggz moet echter nog komen. Voorlopig blijft het doodstil na een klein bericht op een website midden in de maand augustus. Maar de maatschappelijke reflectie gaat ongetwijfeld nog komen.

‘Uitkomstgerichtheid’ als kwaliteitsprincipe in de zorg

Kern van de zaak is de breed gedeelde observatie dat de introductie van de marktwerking in 2006 de zorg niet aantoonbaar beter heeft gemaakt – Marcel Levi spreekt zelfs van een ‘dramatische flop’ (Levi, 2018) . De huidige dynamiek van personeelsgebrek, toenemende verdringing en onduidelijke beleidsvoornemens tot ‘verplaatsing’, ‘vervanging’ en ‘voorkomen’ van zorg – die grote investeringen eisen – zijn in niet onbelangrijke mate terug te voeren op het falen van de marktwering in de zorg. Grote pijn is dat zorgverzekeraars niet conform het marktwerkingsmodel kunnen inkopen op kwaliteit – die is immers wetenschappelijk gezien dynamisch, pluriform en relationeel (Koksma & Kremer, 2019) – maar dit accepteren is niet mogelijk want daarmee zou het fundament onder het principe van marktwerking worden getrokken. Dus in plaats van het systeem van marktwerking aan te passen aan de realiteit van de patiëntenzorg, moet de patiëntenzorg zich aanpassen aan de utopie van de markt als vehikel van kwaliteit.

Introductie van de marktwerking heeft de zorg niet aantoonbaar beter gemaakt

Tegen deze achtergrond kunnen we begrijpen waarom het gebruik van het woord ‘kwaliteit’, als we het hebben over de zorg, in Nederland in het laatste decennium onlosmakelijk verbonden is geraakt aan registratie en opslag van ‘data’, vooral zogeheten ‘uitkomstdata’. Dergelijke data, heet het, openen de deur naar ‘transparantie’, ‘patiëntregie’, ‘keuzemogelijkheid’ en ‘van elkaar leren’.  Het zou gaan, kortom, om de ultieme vorm van kwaliteit.

De nieuwe data-gedreven kwaliteitsideologie heeft geresulteerd in een explosieve en zelfs voor Nederland ongekende datahonger, geïllustreerd in de opdracht van het ministerie van VWS en Zorginstituut Nederland dat in 2022 de uitkomsten van 50 procent van de ziektelast in Nederland geregistreerd moet zijn. Waarom? Omdat het dan eindelijk mogelijk gaat zijn voor zorgverzekeraars om in te kopen op kwaliteit.

De casus van de ggz

Het was de ggz waar de laatste tien jaar de verreweg meest ambitieuze poging werd ondernomen om het concept van VBHC in Nederland te laten landen.

Het begon rond 2011, toen zorgverzekeraars en ambtenaren van het ministerie van VWS in het kader van bestuurlijke akkoorden in de sector de voorwaarde van ‘uitkomstmetingen’ lieten opnemen. Men legde het veld op dat voor iedere patiënt die in de ggz kwam, het ‘resultaat’ moest worden vastgelegd met een beginmeting en eindmeting van de symptomen. Het verschil in symptoomscore tussen begin en eind, de zogenaamde delta-T, was dan het ‘resultaat’ van de behandeling. Hoe hoger de delta-T, des te beter het ‘resultaat’. Deze data moesten op vaste momenten met vaste instrumenten in de behandeling worden afgenomen en worden opgeslagen in de datakluis van de Stichting Benchmark ggz, die werd betaald door de zorgverzekeraars. Patiënten werd geen toestemming gevraagd – hoewel er voor de wet sprake was van persoonsgegevens die de ggz-instelling verliet op weg naar een externe partij. Het idee was dat de Stichting Benchmark ggz aan de hand van de gemiddelde delta-T van een instelling zou kwantificeren hoe ‘goed’ de instelling het deed. De instellingen werden aldus ‘gebenchmarkt’, zodat de zorgverzekeraar resultaatgericht kon inkopen.

Toen dit plan bekend werd, volgden scherpe reacties uit de ggz.  De hoogleraren psychiatrie schreven in 2012 een scherp commentaar, waarin werd uitgelegd dat het benchmarken van instellingen met dergelijke ‘dirty’ data helemaal niet mogelijk is, zoals overigens reeds was aangetoond door Citizen Science in het Verenigd Koninkrijk (van Os e.a., 2012, Hafkenscheid & Van Os, 2014, Hafkenscheid & van Os, 2018) en het Danish National Indicator Project in Denemarken (Pedersen e.a., 2012).

Citizen Science, ondersteund door wetenschappers uit Cambridge, had aangetoond, in een project rond het vergelijken van kindercardiochirurgieresultaten in het Verenigd Koninkrijk, dat je een instelling hoogstens met met zichzelf kan vergelijken over de tijd: zijn de resultaten van deze instelling binnen de range van verwachte resultaten? Maar dit willen VWS en de zorgverzekeraars niet, omdat de marktideologie is gebaseerd op concurrentie tussen instellingen, en niet op het aantoonbaar vermogen van instellingen om te leren en verbeteren over de tijd.

Ook de Algemene Rekenkamer was kritisch over benchmarken in het rapport Bekostiging van de curatieve geestelijke gezondheidszorg, waarin werd gesteld dat dataverzamelingen als beoogd door de Stichting Benchmark ggz onbetrouwbaar, incompleet en onvergelijkbaar waren ten behoeve van het doel waarvoor ze werden verzameld (Algemene Rekenkamer, 2017).

Professionals en patiënten in de ggz wezen verder op het feit dat het bekijken van psychisch lijden door de medische bril van DSM-diagnosen en symptoombestrijding niet goed past omdat ‘beter worden’ van psychisch lijden meer te maken heeft met een proces van acceptatie en weerbaarheidsbevordering over de tijd, en bovendien vaak een sterk existentieel karakter heeft (van Os e.a., 2019). Patiënten vragenlijsten laten invullen – nog voordat ze iemand hebben gezien – waarin hun lijden direct wordt ‘ontvoerd’ naar een wereld van ‘symptomen’ en ‘ziekten’ is een zowel klinisch als ethisch dubieuze interventie.

Patiënten begonnen te klagen dat persoonsgegevens zonder hun toestemming werden geleverd aan een externe database van een Stichting die werd bekostigd door de zorgverzekeraars, die geen aantoonbaar doel kon dienen maar desalniettemin data van alle ggz-patiënten in Nederland geleverd wilde krijgen op straffe van boetes door de zorgverzekeraars. Er werd door patiënten een handhavingsverzoek ingediend bij de Autoriteit Persoonsgegevens, die echter gedurende jaren probeerde de zaak af te houden.

Op het hoogtepunt beheerde de Stichting Benchmark ggz de ggz-trajecten van waarschijnlijk 2 miljoen Nederlanders 

Ondanks verzet van professionals en patiënten, die zich hadden verenigd in een groeiende beweging van ‘tegenmacht’, werd de ggz gedwongen om gedurende bijna tien jaar persoonsgegevens van patiënten in te leveren bij de Stichting Benchmark ggz. Op het hoogtepunt beheerde de Stichting Benchmark ggz de ggz-trajecten van waarschijnlijk 2 miljoen Nederlanders (precieze cijfers zijn nooit gepubliceerd). De totale kosten over de periode 2011-2019 waren minimaal 100 miljoen euro.

En wat kwam uit de data? Uit de schaarse publieke analysen van de Stichting Benchmark ggz bleek wat Citizen Science, de Algemene Rekenkamer en de hoogleraren psychiatrie al eerder hadden aangetoond: dat er enorme regionale variatie was in delta-T die echter niet te interpreteren was omdat de Stichting Benchmark ggz geen gegevens had over de achtergrond van patiënten en hun omstandigheden. Dat kan ook niet, want om die voor elke ggz-patiënt te verzamelen is onmogelijk.

Omdat de zorgverzekeraars zo veel nadruk legden op het aantonen van een zo hoog mogelijke delta-T, ontstond er druk op ggz-instellingen om zich te richten op patiënten met een hoge kans op ‘genezing’ (hoge delta-T) en zich minder open te stellen voor ‘moeilijke’ patiënten (lage delta-T). Als gevolg hiervan werd het voor huisartsen steeds moeilijker om patiënten te verwijzen met een combinatie van verslaving, agressie, suïcidaliteit, persoonlijkheidsproblematiek, autisme en chronische psychose (Van Os & Delespaul, 2018).

In augustus 2019 kwam er definitief een roemloos einde aan de dataverzameling van de Stichting Benchmark ggz. De Autoriteit Persoonsgegevens, onder druk van patiënten die handhaving eisten en hiertoe rechtszaken gingen voeren, liet in mei 2019 eindelijk weten dat het ging om persoonsgegevens waarvoor patiënttoestemming of wettelijke grondslag benodigd is. Hierop werd, aangekondigd door AKWA, waarin de Stichting Benchmark ggz inmiddels was opgegaan, dat de data zouden worden vernietigd. Het bericht op de website werd strategisch geplaatst in het midden van de zomer.

Conclusie

De vraag is wat de opkomst en ondergang van het benchmarken in de ggz gaat betekenen voor de tientallen andere databases die inmiddels zijn opgezet om de introductie van Value-Based Health Care ten behoeve van marktwerking en concurrentie in de zorg te faciliteren. Ook voor deze externe databases geldt dat ze wetenschappelijk niet geschikt zijn om te benchmarken ten behoeve van de zorginkoop en dat het persoonsgegevens betreft die de instelling hebben verlaten zonder toestemming van patiënten.

De Raad voor Volksgezondheid en Samenleven heeft in het rapport Blijk van vertrouwen – Anders verantwoorden voor goede zorg een oproep gedaan om zorginstellingen niet langer te dwingen in de rol van leverancier van vertrouwelijke patiëntendata waaruit externe partijen een kwaliteits- cq benchmarkoordeel proberen te destilleren. Het holt de zorg uit en geeft geen goed beeld van kwaliteit. In plaats daarvan moet er weer een focus komen op kwaliteit waar die ontstaat: op het niveau van de relatie tussen zorgvrager en zorgverlener en de juiste afstemming van medische zorg op de leefwereld van de patiënt (Raad voor Volksgezondheid en Samenleving, 2019).

waar is de reflectie op dit mislukte experiment?

De komende jaren wordt het spannend: volharden VWS en ZIN in hun wens om de zorg te dataficeren om het marktwerkingsexperiment te kunnen valideren, of geven we weer ruimte aan kwaliteit die zich wil manifesteren in zorgzame interacties op de werkvloer?

Maar de belangrijkste vraag die blijft liggen is deze: waar is de reflectie op dit mislukte experiment? Blijft het bij een klein berichtje op de website van AKWA, of gaan we proberen van deze ervaring te leren? Veel partijen (VWS, ZIN, NZA, MIND, NIP, GGZ-Nederland, NVVP) waren bij dit experiment betrokken en er werd veel strijd geleverd. Hoe mooi zou het zijn als men bereidheid toonde om van dit échec te leren. Is dat men niet verplicht aan die honderdduizenden patiënten van wie intieme gegevens in een dubieuze databank terecht kwamen, zonder dat ze daarvan op de hoogte waren? Hebben we niet de plicht ervoor te zorgen dat dit nooit meer kan gebeuren?

Referenties
  •  Algemene Rekenkamer. RAPPORT ALGEMENE REKENKAMER “BEKOSTIGING VAN DE CURATIEVE GGZ”. Den Haag: Algemene Rekenkamer; 2017.
  • Hafkenscheid A, Van Os J. Naar een deugdelijke ROM. Maandblad Geestelijke Volksgezondheid. 2014;69(1):20-8.
  • Hafkenscheid A, van Os J. Twee misvattingen over ROM. De Psycholoog. 2018(April):34-44.
  • Koksma JJ, Kremer JAM. Beyond the Quality Illusion: The Learning Era. Acad Med. 2019;94(2):166-9.
  • Levi M. Evidencebased beleid. Medisch Contact. 2018;43:13.
  • Pedersen CG, Gradus JL, Johnsen SP, Mainz J. Challenges in validating quality of care data in a schizophrenia registry: experience from the Danish National Indicator Project. Clin Epidemiol. 2012;4:201-7.
  • Raad voor Volksgezondheid en Samenleving. Blijk van vertrouwen – Anders verantwoorden voor goede zorg. Den Haag: Raad voor Volksgezondheid en Samenleving; 2019.
  • Van Os J, Delespaul P. Een Valide Kwaliteitskader Voor De GGZ: Van Benchmark-ROM Aan De Achterkant Naar Regionale Regie en Co-creatie Aan De Voorkant. Tijdschrift voor Psychiatrie. 2018;60:96-104.
  • van Os J, Guloksuz S, Vijn TW, Hafkenscheid A, Delespaul P. The evidence-based group-level symptom-reduction model as the organizing principle for mental health care: time for change? World Psychiatry. 2019;18(1):88-96.
  • van Os J, Kahn R, Denys D, Schoevers RA, Beekman AT, Hoogendijk WJ, e.a. [Behavioural standard or coercive measure? Some considerations regarding the special issue on ROM]. Tijdschr Psychiatr. 2012;54(3):245-53.

Delen