De fabeltjes van Menzis en NHR - Arts en Auto

De fabeltjes van Menzis en NHR

Armand Girbes
Prof. dr. Armand Girbes is intensivist-klinisch farmacoloog en hoofd afdeling ICV VUmc Lees alle artikelen van Armand Girbes

Kortgeleden is de Nederlandse HartRegistratie (NHR) opgericht en tegen betaling van ruim € 80.000,-mag een ziekenhuis nu de eigen gegevens aanleveren, een stijging van € 20.000 ten opzichte van 2017 overigens voor mijn ziekenhuis.

De NHR gaat voortvarend van start en komt een half jaar na de oprichting (door fusies) volop in de publiciteit met een afspraak met zorgverzekeraar Menzis om met een select gezelschap van 10 ziekenhuizen een nieuw betalingsmodel te introduceren voor de behandeling van hartaandoeningen. Bedoeling van de overeenkomst tussen NHR en Menzis is, zo stellen beide partijen, om kwaliteitsverbetering te belonen, want – volgens de NHR en Menzis – kunnen verbeterprojecten nu leiden tot een daling van de inkomsten voor een ziekenhuis.

Het project houdt kort gezegd in dat wanneer een ziekenhuis beter presteert in termen van uitkomsten (overleving en heroperatie) daar een financiële beloning tegenover staat. Dat klinkt nobel, maar bij eerste lezing geloofde ik er eerlijk gezegd niets van dat dit mogelijk zou zijn. Nog sterker: ik moest vooral aan de risico’s denken die dat zou opleveren voor patiënten, van wie ik er zelf ook veel dagelijks zie op de intensive care afdeling.

Dat ongeloof baseer ik mede op het feit dat wij zojuist een grote studie hadden gepubliceerd – weliswaar over intensive care patiënten – waarbij wij aantoonden dat zelfs in zorgvuldige prospectieve studies (waarbij patiëntenkarakteristieken nog nauwkeuriger worden vastgelegd dan in de dagelijkse praktijk) de vastgelegde gegevens minder voorspellend waren voor de uitkomst van de patiënt dan de niet-vastgelegde gegevens. In gewoon Nederlands: er klopt maar heel weinig van de voorspelling van de uitkomst aan de hand van de gemeten gegevens van de patiënt. U kunt het hier nalezen.

Er klopt maar heel weinig van de voorspelling van de uitkomst aan de hand van de gemeten gegevens van de patiënt

Ook is het bedenkelijk dat ‘kwaliteit’ gelijkgesteld wordt met ‘geen tweede operatie/ingreep’. Onzin natuurlijk en het geeft een perverse prikkel om patiënten niet opnieuw te opereren. Maar ja, aan de NHR zijn de wetenschappelijke verenigingen van de cardiologen en hartchirurgen verbonden en daar zitten ook knappe wetenschappers, dus reden genoeg voor mij om aan mijn inzicht te twijfelen. Om die reden heb ik direct meerdere collegae geraadpleegd, onder andere collega Harm-Jan de Grooth (eerste auteur van het artikel) en een collega die onderzoek heeft gedaan naar het effect van financiële prikkels op de kwaliteit van zorg in het buitenland. Deze blog is dan ook de vrucht van ons gezamenlijke overleg. Neemt u mij niet kwalijk dat er nu iets meer jargon in de blog staat, maar het is bedoeld om de potentiële patiënten, u en ik wellicht, munitie te geven om hiertegen in opstand te komen.

Menzis ziet geen aanleiding om te vrezen dat hoog-risicopatiënten minder toegang krijgen tot zorg omdat in het vergelijkingsmodel ‘rekening wordt gehouden met de zorgzwaarte van patiënten’. Hiervoor is dan natuurlijk wel een betrouwbare indicator nodig die de verschillen in zorgzwaarte tussen patiënten betrouwbaar meet en inzichtelijk maakt. Maar helaas, voor het risico op complicaties na een dotterprocedure of hartoperatie bestaat er – de marketing van Menzis ten spijt – geen betrouwbare indicator van zorgzwaarte. Dat blijkt uit hun eigen gegevens van Meetbaar Beter, de voorloper van de Nederlandse Hart Registratie.

Voor bijvoorbeeld het voorspellen van het risico op een re-interventie na een dotterprocedure is met de gegevens van 83.000 patiënten een model ontwikkeld dat rekening houdt met 12 patiënt-gerelateerde factoren [Meetbaar Beter Boek 2017 p.55]. Een indruk van de betrouwbaarheid van dit voorspellingsmodel krijgen we door te kijken naar de c-statistic van 0.63, door Meetbaar Beter optimistisch geduid als ‘matig’. In de reguliere wetenschappelijke literatuur zou een voorspellingsmodel met een c-statistic van 0.63 geclassificeerd worden als poor, dus ‘pover’ of ‘onvoldoende’ en zelfs op de grens van failure (<0.60). Het voorspellingsmodel voor het optreden van een hartinfarct na een dotterprocedure presteert al even slecht (c-statistic 0.64) [Meetbaar Beter Boek 2017 p. 54]. In gewoon Nederlands: dat voorspelmodel is onbruikbaar.

Is er dan een beter model denkbaar? Nee, betere modellen om te rekenen met zorgzwaarteverschillen liggen niet binnen handbereik. Ook met extra patiënt-gerelateerde variabelen en met de toepassing van geavanceerde machine-learning technieken verbetert de c-statistic slechts 2 procent. In de methodologische verantwoording concludeert Meetbaar Beter daarom terecht dat “de huidige data niet toereikend [zijn] om op individueel patiëntniveau goed genoeg te kunnen voorspellen” [Meetbaar Beter Boek 2017 p. 187]. En ook de groepen zullen niet groot genoeg zijn om verschillen aan te tonen. Hoe Menzis toch op een betrouwbare manier rekening gaat houden met zorgzwaarte is een raadsel.

Voor uitkomsten op lange- en middellange termijn zijn ongemeten of onmeetbare patiënteigenschappen zoals sociaaleconomische status of leefgewoonten waarschijnlijk even belangrijk als ‘harde’ factoren zoals leeftijd of diabetes. Wanneer deze ongemeten factoren ongelijk verdeeld zijn over verschillende ziekenhuizen, ontstaan er kunstmatige verschillen in meetbare kwaliteitsindicatoren. Dit probleem wordt concreet als we een blik werpen op de 1-jaarsmortaliteit na een dotterbehandeling in de kleinere cardiologische interventiecentra [Meetbaar Beter Boek 2017 p.58]. De centra die slechter presteren dan verwacht, staan in steden en wijken met een lager gemiddeld inkomen dan de centra die beter presteren dan verwacht (Venray, Rotterdam zuid en Tilburg versus Hilversum en Alkmaar), hoewel alle centra nog binnen de foutmarge presteren.

Het is lovenswaardig dat ziekenhuizen zichzelf de maat nemen door deel te nemen aan initiatieven als Meetbaar Beter en de Nederlandse Hart Registratie, ofschoon een discussie over de daadwerkelijke opbrengst versus de kosten nog wel gevoerd mag worden. De slecht presterende modellen om te corrigeren voor zorgzwaarte zijn wellicht beter dan kale vergelijkingen. Maar kritische zelfstudie is iets fundamenteel anders dan de beloning-naar-prestatie die Menzis nu voorstaat.

Het is volstrekt onduidelijk hoe Menzis op een betrouwbare manier denkt te kunnen corrigeren voor zorgzwaarte als experts op dit gebied concluderen dat de meetbare gegevens gewoonweg niet toereikend zijn complicatierisico’s op een valide manier te voorspellen. Daarnaast zal deze methode van zorginkoop voor extra administratiedruk zorgen, om nog maar te zwijgen over de mogelijkheden om het systeem te manipuleren. In Engeland zijn gevallen bekend waarbij dure consultants zich specialiseren in het zodanig coderen en aanleveren van data dat gestandaardiseerde kwaliteitsindicatoren op magische wijze verbeteren.

Hoe is het voor de patiënt gunstig om een slecht presterend ziekenhuis financieel te korten?

Tenslotte is het onduidelijk welke beslissingen Menzis denkt te kunnen sturen met deze methode. Hoe is het voor de patiënt gunstig om een slecht presterend ziekenhuis (als die al geïdentificeerd kan worden, quod non) financieel te korten? Van vrije ziekenhuiskeuze kan geen sprake zijn als je met een acuut hartinfarct in een gillende ambulance naar het dichtstbijzijnde interventiecentrum wordt gereden. Jammer dat nu net in dát ziekenhuis de verpleegkundige bezetting op de hartbewaking tekortschiet omdat Menzis strafkorting heeft uitgedeeld op basis van een bewezen onbetrouwbaar kwaliteitsmodel. En dan zeg ik nog even niets over het grote risico van selectie-bias, dus de dokter wil liever geen hoog-risicopatiënten meer behandelen. Niet omdat het medisch gezien een slechte keuze is, maar omdat het slecht is voor de financiën van het ziekenhuis. Snel ophouden met dit initiatief is dan ook ons wetenschappelijk onderbouwd advies.

15 Reacties Reageer zelf

  1. Jan Kremer
    Geplaatst op 1 mei 2018 om 07:21 | Permalink

    Mooie blog, Armand.

    En moet je nu de ‘slechte’ ziekenhuizen minder betalen (om te straffen) of juist meer (om te kunnen verbeteren).

    Als we niet te grote postcode verschillen willen, moeten we misschien kiezen voor het laatste…

  2. Armand Girbes Armand Girbes
    Geplaatst op 1 mei 2018 om 09:00 | Permalink

    Dank Jan, belangrijk punt dat je maakt.
    Het probleem dat ik heb willen aankaarten is het feit dat wat Menzis en NHR voorstellen niet mogelijk is. Het meten van “kwaliteit” is wat ingewikkelder dan wat zij stellen en hun voorstel is ronduit slecht. Maar, zoals ik eerder al voorstelde kunnen de uitkomsten van metingen wel aanleiding zijn om met elkaar te praten “hoe doen jullie dit?” en in de regio Parijs (CUB-Réa) meet men bv op de IC de SMR (standardized mortality rate en laag is “goed”) en de kosten per patiënt om vervolgens de IC’s met de laagste SMR en laagste kosten te laten praten met de IC’s met de hoogste SMR en hoogste kosten. Om van elkaar te leren. Waarom organiseren we niet iets dergelijks voor de ziekenhuizen in Nederland? En dan bedoel ik niet alleen kijken naar SMR’s alsjeblieft 😉

  3. Ruud Klerks
    Geplaatst op 1 mei 2018 om 14:36 | Permalink

    Dank voor dit Blog! Wil graag dit even delen ter inspiratie. Om ook als gedachte mee te nemen in een plan waarbij vele partijen samen een transmuraal zorgpad maken. In de context van Intensive Care nazorg bijvoorbeeld voor Post Intensive Care Syndroom (PICS).

    Ik citeer: “we need to place a cultural value around health, patients and the things that we do to help people recover from sickness and stay healthy. I think we can find those values in the notion of care. Care is more than the delivery of services or functional transactions between two parties; care implies a relationship. We might even say that care implies a kind of responsibility or a social contract between two parties that goes beyond economic exchange.”

    https://www.gemic.com/the-end-of-patient-centricity/

  4. Ward Bijlsma
    Geplaatst op 1 mei 2018 om 22:34 | Permalink

    Hartelijk dank voor de feedback op het hartcontract tussen zorgaanbieders, Menzis en de NHR. Dit contract is tot stand gekomen na bestudering van internationale best practices en een zorgvuldige afweging van voor- en nadelen. De punten die worden genoemd zijn onderdeel geweest van onze overwegingen en zo veel mogelijk geadresseerd in het startmodel.

    We zijn op zoek naar een model dat meer dan de huidige bekostiging recht doet aan het principe dat kwaliteitsverbetering beloond mag worden. Iets dat nu vaker niet het geval is. De komende 3 jaar zullen partijen binnen het project gezamenlijk het model evalueren, doorontwikkelen en laten voorzien van onafhankelijk advies van experts uit het buitenland. Onder andere zal de mogelijkheid om bepaalde patiëntgroepen buiten het model te laten nader besproken en onderzocht worden.

    Naast de in bovenstaand blog beschreven aandachtspunten zijn er nog diverse andere onderwerpen die gedurende deze periode nader uitgewerkt zullen moeten worden. Na de projectfase zullen we gezamenlijk vaststellen of kwaliteitsverbetering zichtbaar is en of het model meer recht doet aan het principe van belonen van kwaliteit van zorg dan dehuidige bekostiging.

    Graag willen we een paar punten benadrukken.

    De kern van de afspraak is de kwaliteitsverbetering door de community van hartcentra. De centra gaan gezamenlijk, waar gewenst met ondersteuning van de NHR, aan de slag om ervaringen en werkwijzen te delen om de uitkomsten voor patiënten verder te verbeteren. De financiële afspraak is daaraan een bijdrage, niet een doel op zich. De ambitie is om met de financiele afspraak de prikkel van aantallen behandelingen, naar betere uitkomsten te verschuiven en daarmee meer gelijkgerichtheid tussen artsen (kwaliteit) en management en bestuurders (financiën) te creëren. De statistische modellen helpen op basis van de beschikbare data dit zo fair mogelijk te doen door de kans op goede uitkomsten te corrigeren voor patientkenmerken.

    Deze modellen zijn ondanks de onafhankelijke validatie bij het opstellen en peer review bij de publicatie, niet perfect zoals transparant gemaakt met de c-statistic. Daarbij willen we opmerken dat er ook variabelen zijn met een veel hogere c-statistic zoals overleving. Daarnaast kan een lagere c-statistic niet enkel verklaard worden door verschillen in patiëntkarakteristieken, maar ook verklaard worden door variatie in zorgprocessen tussen zorgaanbieders, iets wat in het kader van kwaliteitsverbetering juist een interessant gegeven kan zijn.

    Omdat we ons beseffen dat het contract niet meteen perfect is, starten we met een beperkte financiele impact en ontwikkelen we deze komende jaren door met de deelnemers. Daarmee doen we niet alleen aan kwaliteitsverbetering van de zorg zelf, maar ook van de manier waarop deze vergoed wordt.

    Ward Bijlsma, Manager Zorg bij Menzis

  5. Gijs van Loef
    Geplaatst op 2 mei 2018 om 11:30 | Permalink

    Alhoewel ik medisch gezien een leek ben, kan ik deze discussie op hoofdlijnen toch wel min of meer volgen. Het lijkt me een casus die de beperkte toepasbaarheid van VBHC en de dreigende infectie van perverse prikkels mooi onderstreept.

  6. Armand Girbes Armand Girbes
    Geplaatst op 2 mei 2018 om 15:51 | Permalink

    Ik merk op dat vandaag opeens informatie die gewoon beschikbaar was via het internet nu kennelijk verdwenen is, hetgeen mij bevreemdt. Het gaat om de volgende informatie:

    De brief van Menzis/NHR is nu onvindbaar….
    https://nederlandsehartregistratie.nl/pdf/20180404-Bekostigingsmodel-Hartzorg-NHR-Menzis.pdf

    Evenals het Meetbaar Beter boek:
    https://nederlandsehartregistratie.nl/pdf/20171207-MeetbaarBeter_2017_LR_DEF.pdf

    Het lijkt me niet in het belang van de discussie dat relevante informatie nu geblokkeerd wordt, ervan uitgaande dat het hier om een opzettelijke actie gaat en niet om een computerstoring of het wegraken van een memo. Ik hoop dat de informatie spoedig weer beschikbaar zal zijn

  7. Armand Girbes Armand Girbes
    Geplaatst op 2 mei 2018 om 16:21 | Permalink

    Dan nog ene korte reactie op het commentaar van Menzis. Als ik het goed heb dan was de reactie van Menzis tegen de bezorgde patiëntenvereniging dat er in de modellen “rekening wordt gehouden met zorgzwaarte van patiënten”. Maar geconfronteerd met onze analyse op basis van expertise stelt Menzis nu dat de modellen “niet perfect” zijn, hetgeen wat mij betreft een understatement is.

    Maar de vraag hoe Menzis wil “vaststellen of kwaliteitsverbetering zichtbaar is” als er geen valide maat is om kwaliteit mee te meten blijft onbeantwoord.
    En wat moeten we toch steeds met “onafhankelijke experts uit het buitenland”? In welk fantastisch buitenland werkt dit systeem dan aantoonbaar? Het antwoord is toch niet de USA, hoop ik.

  8. E.Kriek
    Geplaatst op 3 mei 2018 om 22:43 | Permalink

    Op social media blijken volksstammen reputatiemanagers en communicatieadviseurs actief om dit initiatief van Menzis te ” ondersteunen” , merk ik.
    Wat natuurlijk de vraag opwerpt in hoeverre de ( op discutabele gronden gebaseerde) “bezuinigingen” de opbrengsten rechtvaardigen.
    In deze periode van transparantie vraag ik dus aan Menzis:
    1.Hoeveel communicatieadviseurs, reputatiemanagers en andere hulptroepen heeft u in dienst?
    2. Wat kost dat de premiebetaler?
    3. Hoe verhouden de “opbrengsten” van dit project zich tot de kosten van 1 en 2?
    Dank.

  9. E. Kriek
    Geplaatst op 3 mei 2018 om 23:16 | Permalink

    Een kleine aanvulling : ik leg de link tussen uw ‘ kwaliteitsproject’ en bezuinigingen.
    Bron: uw jaarverslag:

    ‘ maar tegelijkertijd levert dit spanning op die de solidariteit in de zorg onder druk zet. Want in hoeverre zijn mensen nog bereid om mee te betalen aan de zorgkosten van een ander? Menzis maakt zich hier zorgen over en biedt hierin een antwoord. We kopen waardegerichte zorg in’.

  10. J.Bessems
    Geplaatst op 4 mei 2018 om 15:17 | Permalink

    Harry Porter en de Orde van de Menzix?

  11. Alberts
    Geplaatst op 8 mei 2018 om 13:56 | Permalink

    Kortom,
    dit verhaal is onzin, gestoeld op drijfzand, maar men doet het toch.

  12. Hanneke Takkenberg
    Geplaatst op 9 mei 2018 om 10:51 | Permalink

    Beste collega Girbes,
    Dank voor deze scherpe blog!
    Kritische reflectie is zeker op zijn plaats, zie ook:

    https://academic.oup.com/icvts/article/20/6/691/677854

    en

    https://academic.oup.com/ejcts/article/45/2/211/442799

    Hanneke Takkenberg
    Hoogleraar Klinische besliskunde in cardio-thoracale interventies
    Erasmus MC

  13. Frank Conijn
    Geplaatst op 28 mei 2018 om 15:13 | Permalink

    Geachte prof. Girbes,

    Uw artikel is genoemd en door mij becommentarieerd in de discussie onder het artikel op https://www.skipr.nl/actueel/id34703-schrapkoorts-zet-vbhc-onder-druk.html.

    Om meerdere redenen zie ik uw eventuele reactie graag daar tegemoet. Mocht u erop willen reageren, dan zou ik u willen verzoeken om de discussie vanaf het begin door te nemen, zelfs al is het bij elkaar een ‘long read’ geworden. Dat zal waarschijnlijk het nodige typwerk schelen.

    Met dank bij voorbaat en vriendelijke groet,

    Frank Conijn

  14. Armand Girbes Armand Girbes
    Geplaatst op 3 juni 2018 om 21:17 | Permalink

    Geachte heer Conijn, dank voor uw inhoudelijke reactie. Als gevraagd gedaan op Skipr. Te vinden via uw link. Voor het gemak hier ook:

    Een korte reactie op verzoek van dhr. Conijn van Conijn Consultancy op zijn opmerkingen. Allereerst deel ik zijn mening dat vooral aandacht gegeven moet worden aan uitkomstindicatoren en dat inzicht in (een vorm van) kwaliteit van zorg beschikbaar moet zijn voor ons burgers. In mijn blog heb ik gepoogd aan te geven dat er nou eenmaal veel is wat we niet (kunnen) meten maar wat wel belangrijk is. Een manco van een blog is dat het niet peer-reviewed is en dat het niet op wetenschappelijke waarde is getoetst wanneer van toepassing. Daarom heb ik ons recente artikel over sepsis als onderbouwing van het betoog willen geven. In dat artikel beschrijven wij dat mortaliteit bij septische shock meer bepaald werd in de gepubliceerde wetenschappelijke studies door factoren die niet gemeten werden dan door factoren/kenmerken die wél gemeten werden. Het betoog van dhr. Conijn komt er op neer dat hij mijn kritiek deelt en stelt dat hij een registratiesysteem heeft dat dit ondervangt. Daarbij merk ik nogmaals op dat kwaliteit van zorg nou eenmaal heel lastig goed en precies te definiëren is en heel veel belangrijke zaken NIET te meten zijn. Maar graag zie ik uit naar de peer-reviewed gepubliceerde gegevens die het betoog van dhr. Conijn onderbouwen. Tenslotte merk ik op dat manipulatie van gegevens niet hetzelfde is als valsheid in geschrifte.

  15. Frank Conijn
    Geplaatst op 25 juli 2018 om 18:34 | Permalink

    @Prof. Girbes — Ik las uw reactie op Skipr helaas pas enkele dagen geleden. Ik heb die pagina een paar dagen gevolgd en toen daar geen verdere reacties meer op kwamen is hij in de vergetelheid geraakt, mede door mijn drukke werkzaamheden. Die overigens niet voor zorgverzekeraars zijn. Ik propageer een single, publieke zorgverzekeraar; zie https://gezondezorg.org/een-zorgverzekeraar.php.

    U merkt nogmaals op dat kwaliteit van zorg nou eenmaal heel lastig goed en precies te definiëren is en heel veel belangrijke zaken niet te meten zijn. Maar dan stel ik de wedervraag: kunt u me drie van die heel veel belangrijke zaken noemen? Want ik meen alle belangrijke zaken inmiddels gedekt te hebben, maar sta uiteraard altijd open voor lacunes en omissies.

    Verder zou u graag het wetenschappelijke bewijs zien voor mijn systeem, althans ga ik er van uit dat dat is wat u bedoelt met peer-reviewed gepubliceerde gegevens die mijn betoog onderbouwen. De facto gaat het dan om validering. Valideringsonderzoek zit in de planning en het reproduceerbaarheidsaspect is goed te onderzoeken.

    Het aspect validiteit is veel lastiger, want er is geen gouden standaard. En er zijn überhaupt geen andere vragenlijsten die in één keer corrigeren voor de zaken waar de mijne voor corrigeren. Dus zegt een vergelijking met een andere vragenlijst dan iets over de mijne of over de andere?

    Verder kom je met logisch en redelijk redeneren ook een heel eind. In dit geval wellicht nog wel verder dan met vergelijken. Ik zou graag ook het validiteitsaspect laten onderzoeken, maar dat moet natuurlijk wel zinvol zijn.