Opkomst en ondergang van benchmarken in de ggz

Jim van Os
Jim van Os is voorzitter van de Divisie Hersenen van het UMC Utrecht en wil een lans breken voor behoud van betekenisvol kunnen werken in de zorg. Lees alle artikelen van Jim van Os

Hier bespreek ik het verhaal van het waarschijnlijk meest ambitieuze plan ooit om het proces van psychisch lijden, en de pogingen van behandelaars om daar verlichting in te brengen, uit te drukken in kwantitatieve data ten behoeve van een financieel concurrentiesysteem van gezondheidszorg dat werd uitgevonden aan de Harvard Business School en bekend staat als het principe van Value-Based Health Care (VBHC). VBHC is onbewezen – en waar onderzocht niet effectief – maar desondanks officieel omarmd door de top van het ministerie van VWS en menig zorgverzekeraar en ‘zorgeconoom’.

Het experiment in de ggz begon rond 2011, was groots opgezet en had een nationale trots moeten worden. Het eindigde echter in 2019, 100 miljoen euro later, met de vernietiging van een psychische database met gegevens over de suïcidaliteit, verslaving, seksualiteit en paranoia van naar schatting 2 miljoen Nederlanders (cijfers hierover zijn nooit bekend gemaakt). De reflectie op dit waarschijnlijk grootste échec in de geschiedenis van de Nederlandse ggz moet echter nog komen. Voorlopig blijft het doodstil na een klein bericht op een website midden in de maand augustus. Maar de maatschappelijke reflectie gaat ongetwijfeld nog komen.

‘Uitkomstgerichtheid’ als kwaliteitsprincipe in de zorg

Kern van de zaak is de breed gedeelde observatie dat de introductie van de marktwerking in 2006 de zorg niet aantoonbaar beter heeft gemaakt – Marcel Levi spreekt zelfs van een ‘dramatische flop’ (Levi, 2018) . De huidige dynamiek van personeelsgebrek, toenemende verdringing en onduidelijke beleidsvoornemens tot ‘verplaatsing’, ‘vervanging’ en ‘voorkomen’ van zorg – die grote investeringen eisen – zijn in niet onbelangrijke mate terug te voeren op het falen van de marktwering in de zorg. Grote pijn is dat zorgverzekeraars niet conform het marktwerkingsmodel kunnen inkopen op kwaliteit – die is immers wetenschappelijk gezien dynamisch, pluriform en relationeel (Koksma & Kremer, 2019) – maar dit accepteren is niet mogelijk want daarmee zou het fundament onder het principe van marktwerking worden getrokken. Dus in plaats van het systeem van marktwerking aan te passen aan de realiteit van de patiëntenzorg, moet de patiëntenzorg zich aanpassen aan de utopie van de markt als vehikel van kwaliteit.

Introductie van de marktwerking heeft de zorg niet aantoonbaar beter gemaakt

Tegen deze achtergrond kunnen we begrijpen waarom het gebruik van het woord ‘kwaliteit’, als we het hebben over de zorg, in Nederland in het laatste decennium onlosmakelijk verbonden is geraakt aan registratie en opslag van ‘data’, vooral zogeheten ‘uitkomstdata’. Dergelijke data, heet het, openen de deur naar ‘transparantie’, ‘patiëntregie’, ‘keuzemogelijkheid’ en ‘van elkaar leren’.  Het zou gaan, kortom, om de ultieme vorm van kwaliteit.

De nieuwe data-gedreven kwaliteitsideologie heeft geresulteerd in een explosieve en zelfs voor Nederland ongekende datahonger, geïllustreerd in de opdracht van het ministerie van VWS en Zorginstituut Nederland dat in 2022 de uitkomsten van 50 procent van de ziektelast in Nederland geregistreerd moet zijn. Waarom? Omdat het dan eindelijk mogelijk gaat zijn voor zorgverzekeraars om in te kopen op kwaliteit.

De casus van de ggz

Het was de ggz waar de laatste tien jaar de verreweg meest ambitieuze poging werd ondernomen om het concept van VBHC in Nederland te laten landen.

Het begon rond 2011, toen zorgverzekeraars en ambtenaren van het ministerie van VWS in het kader van bestuurlijke akkoorden in de sector de voorwaarde van ‘uitkomstmetingen’ lieten opnemen. Men legde het veld op dat voor iedere patiënt die in de ggz kwam, het ‘resultaat’ moest worden vastgelegd met een beginmeting en eindmeting van de symptomen. Het verschil in symptoomscore tussen begin en eind, de zogenaamde delta-T, was dan het ‘resultaat’ van de behandeling. Hoe hoger de delta-T, des te beter het ‘resultaat’. Deze data moesten op vaste momenten met vaste instrumenten in de behandeling worden afgenomen en worden opgeslagen in de datakluis van de Stichting Benchmark ggz, die werd betaald door de zorgverzekeraars. Patiënten werd geen toestemming gevraagd – hoewel er voor de wet sprake was van persoonsgegevens die de ggz-instelling verliet op weg naar een externe partij. Het idee was dat de Stichting Benchmark ggz aan de hand van de gemiddelde delta-T van een instelling zou kwantificeren hoe ‘goed’ de instelling het deed. De instellingen werden aldus ‘gebenchmarkt’, zodat de zorgverzekeraar resultaatgericht kon inkopen.

Toen dit plan bekend werd, volgden scherpe reacties uit de ggz.  De hoogleraren psychiatrie schreven in 2012 een scherp commentaar, waarin werd uitgelegd dat het benchmarken van instellingen met dergelijke ‘dirty’ data helemaal niet mogelijk is, zoals overigens reeds was aangetoond door Citizen Science in het Verenigd Koninkrijk (van Os e.a., 2012, Hafkenscheid & Van Os, 2014, Hafkenscheid & van Os, 2018) en het Danish National Indicator Project in Denemarken (Pedersen e.a., 2012).

Citizen Science, ondersteund door wetenschappers uit Cambridge, had aangetoond, in een project rond het vergelijken van kindercardiochirurgieresultaten in het Verenigd Koninkrijk, dat je een instelling hoogstens met met zichzelf kan vergelijken over de tijd: zijn de resultaten van deze instelling binnen de range van verwachte resultaten? Maar dit willen VWS en de zorgverzekeraars niet, omdat de marktideologie is gebaseerd op concurrentie tussen instellingen, en niet op het aantoonbaar vermogen van instellingen om te leren en verbeteren over de tijd.

Ook de Algemene Rekenkamer was kritisch over benchmarken in het rapport Bekostiging van de curatieve geestelijke gezondheidszorg, waarin werd gesteld dat dataverzamelingen als beoogd door de Stichting Benchmark ggz onbetrouwbaar, incompleet en onvergelijkbaar waren ten behoeve van het doel waarvoor ze werden verzameld (Algemene Rekenkamer, 2017).

Professionals en patiënten in de ggz wezen verder op het feit dat het bekijken van psychisch lijden door de medische bril van DSM-diagnosen en symptoombestrijding niet goed past omdat ‘beter worden’ van psychisch lijden meer te maken heeft met een proces van acceptatie en weerbaarheidsbevordering over de tijd, en bovendien vaak een sterk existentieel karakter heeft (van Os e.a., 2019). Patiënten vragenlijsten laten invullen – nog voordat ze iemand hebben gezien – waarin hun lijden direct wordt ‘ontvoerd’ naar een wereld van ‘symptomen’ en ‘ziekten’ is een zowel klinisch als ethisch dubieuze interventie.

Patiënten begonnen te klagen dat persoonsgegevens zonder hun toestemming werden geleverd aan een externe database van een Stichting die werd bekostigd door de zorgverzekeraars, die geen aantoonbaar doel kon dienen maar desalniettemin data van alle ggz-patiënten in Nederland geleverd wilde krijgen op straffe van boetes door de zorgverzekeraars. Er werd door patiënten een handhavingsverzoek ingediend bij de Autoriteit Persoonsgegevens, die echter gedurende jaren probeerde de zaak af te houden.

Op het hoogtepunt beheerde de Stichting Benchmark ggz de ggz-trajecten van waarschijnlijk 2 miljoen Nederlanders 

Ondanks verzet van professionals en patiënten, die zich hadden verenigd in een groeiende beweging van ‘tegenmacht’, werd de ggz gedwongen om gedurende bijna tien jaar persoonsgegevens van patiënten in te leveren bij de Stichting Benchmark ggz. Op het hoogtepunt beheerde de Stichting Benchmark ggz de ggz-trajecten van waarschijnlijk 2 miljoen Nederlanders (precieze cijfers zijn nooit gepubliceerd). De totale kosten over de periode 2011-2019 waren minimaal 100 miljoen euro.

En wat kwam uit de data? Uit de schaarse publieke analysen van de Stichting Benchmark ggz bleek wat Citizen Science, de Algemene Rekenkamer en de hoogleraren psychiatrie al eerder hadden aangetoond: dat er enorme regionale variatie was in delta-T die echter niet te interpreteren was omdat de Stichting Benchmark ggz geen gegevens had over de achtergrond van patiënten en hun omstandigheden. Dat kan ook niet, want om die voor elke ggz-patiënt te verzamelen is onmogelijk.

Omdat de zorgverzekeraars zo veel nadruk legden op het aantonen van een zo hoog mogelijke delta-T, ontstond er druk op ggz-instellingen om zich te richten op patiënten met een hoge kans op ‘genezing’ (hoge delta-T) en zich minder open te stellen voor ‘moeilijke’ patiënten (lage delta-T). Als gevolg hiervan werd het voor huisartsen steeds moeilijker om patiënten te verwijzen met een combinatie van verslaving, agressie, suïcidaliteit, persoonlijkheidsproblematiek, autisme en chronische psychose (Van Os & Delespaul, 2018).

In augustus 2019 kwam er definitief een roemloos einde aan de dataverzameling van de Stichting Benchmark ggz. De Autoriteit Persoonsgegevens, onder druk van patiënten die handhaving eisten en hiertoe rechtszaken gingen voeren, liet in mei 2019 eindelijk weten dat het ging om persoonsgegevens waarvoor patiënttoestemming of wettelijke grondslag benodigd is. Hierop werd, aangekondigd door AKWA, waarin de Stichting Benchmark ggz inmiddels was opgegaan, dat de data zouden worden vernietigd. Het bericht op de website werd strategisch geplaatst in het midden van de zomer.

Conclusie

De vraag is wat de opkomst en ondergang van het benchmarken in de ggz gaat betekenen voor de tientallen andere databases die inmiddels zijn opgezet om de introductie van Value-Based Health Care ten behoeve van marktwerking en concurrentie in de zorg te faciliteren. Ook voor deze externe databases geldt dat ze wetenschappelijk niet geschikt zijn om te benchmarken ten behoeve van de zorginkoop en dat het persoonsgegevens betreft die de instelling hebben verlaten zonder toestemming van patiënten.

De Raad voor Volksgezondheid en Samenleven heeft in het rapport Blijk van vertrouwen – Anders verantwoorden voor goede zorg een oproep gedaan om zorginstellingen niet langer te dwingen in de rol van leverancier van vertrouwelijke patiëntendata waaruit externe partijen een kwaliteits- cq benchmarkoordeel proberen te destilleren. Het holt de zorg uit en geeft geen goed beeld van kwaliteit. In plaats daarvan moet er weer een focus komen op kwaliteit waar die ontstaat: op het niveau van de relatie tussen zorgvrager en zorgverlener en de juiste afstemming van medische zorg op de leefwereld van de patiënt (Raad voor Volksgezondheid en Samenleving, 2019).

waar is de reflectie op dit mislukte experiment?

De komende jaren wordt het spannend: volharden VWS en ZIN in hun wens om de zorg te dataficeren om het marktwerkingsexperiment te kunnen valideren, of geven we weer ruimte aan kwaliteit die zich wil manifesteren in zorgzame interacties op de werkvloer?

Maar de belangrijkste vraag die blijft liggen is deze: waar is de reflectie op dit mislukte experiment? Blijft het bij een klein berichtje op de website van AKWA, of gaan we proberen van deze ervaring te leren? Veel partijen (VWS, ZIN, NZA, MIND, NIP, GGZ-Nederland, NVVP) waren bij dit experiment betrokken en er werd veel strijd geleverd. Hoe mooi zou het zijn als men bereidheid toonde om van dit échec te leren. Is dat men niet verplicht aan die honderdduizenden patiënten van wie intieme gegevens in een dubieuze databank terecht kwamen, zonder dat ze daarvan op de hoogte waren? Hebben we niet de plicht ervoor te zorgen dat dit nooit meer kan gebeuren?

Referenties
  •  Algemene Rekenkamer. RAPPORT ALGEMENE REKENKAMER “BEKOSTIGING VAN DE CURATIEVE GGZ”. Den Haag: Algemene Rekenkamer; 2017.
  • Hafkenscheid A, Van Os J. Naar een deugdelijke ROM. Maandblad Geestelijke Volksgezondheid. 2014;69(1):20-8.
  • Hafkenscheid A, van Os J. Twee misvattingen over ROM. De Psycholoog. 2018(April):34-44.
  • Koksma JJ, Kremer JAM. Beyond the Quality Illusion: The Learning Era. Acad Med. 2019;94(2):166-9.
  • Levi M. Evidencebased beleid. Medisch Contact. 2018;43:13.
  • Pedersen CG, Gradus JL, Johnsen SP, Mainz J. Challenges in validating quality of care data in a schizophrenia registry: experience from the Danish National Indicator Project. Clin Epidemiol. 2012;4:201-7.
  • Raad voor Volksgezondheid en Samenleving. Blijk van vertrouwen – Anders verantwoorden voor goede zorg. Den Haag: Raad voor Volksgezondheid en Samenleving; 2019.
  • Van Os J, Delespaul P. Een Valide Kwaliteitskader Voor De GGZ: Van Benchmark-ROM Aan De Achterkant Naar Regionale Regie en Co-creatie Aan De Voorkant. Tijdschrift voor Psychiatrie. 2018;60:96-104.
  • van Os J, Guloksuz S, Vijn TW, Hafkenscheid A, Delespaul P. The evidence-based group-level symptom-reduction model as the organizing principle for mental health care: time for change? World Psychiatry. 2019;18(1):88-96.
  • van Os J, Kahn R, Denys D, Schoevers RA, Beekman AT, Hoogendijk WJ, e.a. [Behavioural standard or coercive measure? Some considerations regarding the special issue on ROM]. Tijdschr Psychiatr. 2012;54(3):245-53.

12 Reacties Reageer zelf

  1. J.J.K. Groen
    Geplaatst op 12 september 2019 om 12:46 | Permalink

    Dit gebeurt er als de ‘polder’ een verkeerde beslissing neemt: omdat iedereen boter op zijn hoofd heeft kan er niet op een ‘échec’ worden gereflecteerd.

    Immers de keuze is: meegaan met de koers of verbannen worden uit de polder. Zo ontstaat medeplichtigheid en gegarandeerde reflectieverlegenheid.

    Sterker zelfs: AKWA maakt nog steeds geluiden alsof dit type ‘meten’ in de ggz weer gaat bijdragen aan kwaliteit en vergelijkbaarheid. Iets voorzichtiger, maar nog steeds VBHC oude stijl.

    Hoop dat we alsnog kunnen gaan leren van wat hier gebeurd is.

  2. Evelien Janssen
    Geplaatst op 12 september 2019 om 13:01 | Permalink

    Ja die plicht hebben we. Al was het maar omdat ik bij elkaar opgeteld eindeloos veel tijd kwijt ben geweest met het invullen van nutteloze formulieren – die trouwens in de organisatie nauwelijks werden gebruikt in het klinisch proces, vanwege gebrek aan keuze rond soort en tijdstip van toediening van de vragenlijst.

    Het zou getuigen van respect als iemand verantwoordelijkheid nam voor al die verspilde tijd.

    Dank.

  3. Aad Cense
    Geplaatst op 12 september 2019 om 13:16 | Permalink

    En nu graag nog iemand die een mooi stukje schrijft over de somatiek waarvan je redelijkerwijs mag veronderstellen dat die bij gedetailleerde beschouwing hoogstens gradueel maar niet principieel verschilt van de psychiatrie wat betreft complexiteit, multiconditionaliteit, moeilijk te achterhalen patientvariabelen en verwevenheid met sociaal-maatschappelijke factoren

  4. Kaspar Mengelberg
    Geplaatst op 12 september 2019 om 16:37 | Permalink

    Medische specialisten waaronder psychiaters zijn verplicht om gepseudonimiseerde dbc-patiëntgegevens te leveren aan het dbc-informatiesysteem (DIS). Zie https://www.nza.nl/zorgsectoren/medisch-specialistische-zorg/gegevens-aanleveren.

    De Autoriteit Persoonsgegevens heeft bepaald dat eveneens gepseudonimiseerd bij de Stichting Benchmark ggz.aangeleverde patiëntgegevens, desondanks, toch als persoonsgegevens moeten worden beschouwd en daarom vernietigd moeten worden.

    Conclusie: patiëntgegevens verzameld in het dbc-informatiesysteem (DIS) zijn eveneens persoonsgegevens en dienen daarom te worden vernietigd.

    Zie in dit verband ook https://devrijepsych.files.wordpress.com/2017/03/addendum-bij-hoofdstuk-4-van-het-beroepschrift.pdf

  5. E.Kriek
    Geplaatst op 12 september 2019 om 22:00 | Permalink

    @Aad Cense:

    De manier waarop prof. van Os de zaken ontleedt is niet te overtreffen.

    Maar ik zal een voorzichtige poging wagen, waar het gaat om evidence, VBHC, en somatische ziekten.

    ( Helaas , het gaat slechts om enkele links naar de somatische Evidence . )

    1. Noorwegen. Evaluatie VBHC uit 2016:

    ” At present, QBF represents NOK 500 million or around 0.5 percent
    of the health-regions total block grant budgets. Compared to a block-grant distribution of these NOK 500
    million, the redistribution effect of QBF represents a 10 percent decrease for one health region and the
    corresponding increase for three other regions. ”

    https://www.oecd.org/els/health-systems/Better-Ways-to-Pay-for-Health-Care-Background-Note-Norway.pdf

    2. ” Conclusion
    Overall, the evidence for the effectiveness of P4P for improving quality of care in primary care is mixed.”

    https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4086847/

    3. ” CONCLUSION:
    This study did not show any positive long-term effects of the implementation of P4P on quality of care. Therefore, our results do not support the hypothesis that P4P leads to significant improvements in quality of care.”

    https://www.ncbi.nlm.nih.gov/pubmed/29606288

    4. ” The effects of pay-for-performance are mixed and evidence is scarce. ”

    https://www.sciencedirect.com/science/article/pii/S0168851016302147

    Hoe sterk is het tegengeluid tegen fact free politics?

  6. D. Kamp
    Geplaatst op 13 september 2019 om 12:46 | Permalink

    “In plaats daarvan moet er weer een focus komen op kwaliteit waar die ontstaat: op het niveau van de relatie tussen zorgvrager en zorgverlener en de juiste afstemming van medische zorg op de leefwereld van de patiënt”

    Dit is precies waar het om gaat in de geestelijke gezondheidszorg, wat zorgverzekeraars en VWS nogal eens blijken te vergeten. Het gaat er niet om om de patiënt af te stemmen op jouw metingen, maar zorg te leveren die afgestemd is op de wens van de patiënt, in het belang van de patiënt. Zorgverzekeraars en VWS zouden hier een dienende rol in moeten hebben, geen sturende.

  7. Patrick
    Geplaatst op 13 september 2019 om 18:55 | Permalink

    Prachtig en keihard artikel, ik heb zoals dat eind jaren tachtig heette “verpleeghulp”, dus gewoon je werk doen en daadwerkelijk contact hebben met patiënten. Ik ben natuurlijk maar een gewoon iemand die zich niet hoeft te verschuilen achter allemaal veel te langdradige ‘moeilijke woorden’ allemaal zeker goed bedoeld, maar de ervaring leert dat dit helaas totaal geen zoden aan de dijk zet, wanneer komt er eindelijk een eind aan het beschermen van de functies die men behaald heeft, in godsnaam ga met z’n allen naar afdelingen en steek je gezicht uit naar de hulpvrager, er gaat een wereld voor je open, veel succes en de groeten van Patrick diepenmaat

  8. Jim van Os Jim van Os
    Geplaatst op 14 september 2019 om 09:17 | Permalink

    Iedereen dank voor de reacties. Vandaag is de eerste van een serie analysen gepubliceerd waarin ik onderzoek wat de merites zou zijn van inkopen op basis van indicatoren van populatiezorgbehoefte voor een rechtvaardige, zinnige, zuinige en zorgzame ggz.

    Zie: https://www.tijdschriftvoorpsychiatrie.nl/issues/544/articles/12024

  9. Sylvia nobbe
    Geplaatst op 14 september 2019 om 09:29 | Permalink

    Na het lezen van dit artikel nu een reactie van een psychiatrische patiënt. U krijgt van mij een pluim om zo duidelijk te schrijven wat gaande was en is in mijn wereldje. Als ex clientenraadslid ben ik regelmatig hiermee geconfronteerd tijdens gesprekken met behandelaars die soms meer tijd bezig waren met proberen deze ongewenste inmenging tegen te gaan als met leveren van zorg aan zieken.
    Zorgverzekeraars vreten nog veel meer uit als u schrijft. Hier diepgaand op ingaan is onverstandig met een uitzondering. Het komt zelfs voor dat mensen in een crisissituatie bij gebrek aan plaats tijdelijk in badkamers worden ondergebracht. Niet bepaald een plek om goede zorg te leveren. Over kwaliteit gesproken! Wegbezuinigd.
    Over deze ongewenste manieren om überhaupt zorg te leveren mag ook wel eens een artikel verschijnen.

  10. Anton Hafkenscheid
    Geplaatst op 14 september 2019 om 14:06 | Permalink

    Dat ik dit -zoals altijd stevig onderbouwde én geformuleerde- standpunt van Jim van Os van harte onderschrijf heeft als zodanig weinig nieuwswaarde. Mijn zorg is dat de kloof tussen beleidsmakers met vergezichten (soms: fata morgana’s) en professionals op geen enkele manier kleiner lijkt te worden, terwijl we gewoon tot elkaar veroordeeld zijn. Mijn column voor de NVGzP naar aanleiding van de oprichting van Akwa (link hieronder) gaat daar op in:

    https://www.nvgzp.nl/niet-alles-van-waarde-is-meetbaar-niet-alles-wat-meetbaar-is-is-van-waarde/

  11. Michael Milo
    Geplaatst op 14 september 2019 om 18:54 | Permalink

    Sowieso: benchmarken op basis van professioneel- richtlijngedreven aanbod in een tijd dat we weten dat de er zoveel oplossingen liggen in het publieke domein? Dat vraagt om lef om vanuit “niet-weten” mét alle (multi) deskundigheid op trektocht te gaan. Niet beheersen, maar met elkaar opnieuw begrijpen. Hoe we bijvoorbeeld de kracht de civil society kunnen benutten.

    Voor een klein deel van al die miljoenen kunnen we de “plaatsen van hoop” die hieraan vormgeven ondersteunen en sanen keren.

  12. E.Kriek
    Geplaatst op 16 september 2019 om 19:56 | Permalink

    Vanuit de VBHC consultancy en vanuit de hoek van de zorgeconomen is het ineens stil.
    Terwijl dit een dankbaar en zelfs ideaal moment is om met inhoudelijke tegenargumenten te komen.
    Ik wacht dus met ongeduld.

    ( Met name de consultants die prof. van Os verwijten dat hij wegduikt als hij kritische vragen krijgt
    Tover iets uit uw hoge hoed!
    Dit is uw moment. Uw platform. Uw kans. )

Plaats een reactie

Uw e-mailadres zal nooit gepubliceerd of gedeeld worden. Verplichte velden zijn gemarkeerd met *

*
*