De fabeltjes van Menzis en NHR

Kortgeleden is de Nederlandse HartRegistratie (NHR) opgericht en tegen betaling van ruim € 80.000,- mag een ziekenhuis nu de eigen gegevens aanleveren, een stijging van € 20.000 ten opzichte van 2017 overigens voor mijn ziekenhuis.

De NHR gaat voortvarend van start en komt een half jaar na de oprichting (door fusies) volop in de publiciteit met een afspraak met zorgverzekeraar Menzis om met een select gezelschap van 10 ziekenhuizen een nieuw betalingsmodel te introduceren voor de behandeling van hartaandoeningen. Bedoeling van de overeenkomst tussen NHR en Menzis is, zo stellen beide partijen, om kwaliteitsverbetering te belonen, want – volgens de NHR en Menzis – kunnen verbeterprojecten nu leiden tot een daling van de inkomsten voor een ziekenhuis.

Het project houdt kort gezegd in dat wanneer een ziekenhuis beter presteert in termen van uitkomsten (overleving en heroperatie) daar een financiële beloning tegenover staat. Dat klinkt nobel, maar bij eerste lezing geloofde ik er eerlijk gezegd niets van dat dit mogelijk zou zijn. Nog sterker: ik moest vooral aan de risico’s denken die dat zou opleveren voor patiënten, van wie ik er zelf ook veel dagelijks zie op de intensive care afdeling.

Dat ongeloof baseer ik mede op het feit dat wij zojuist een grote studie hadden gepubliceerd – weliswaar over intensive care patiënten – waarbij wij aantoonden dat zelfs in zorgvuldige prospectieve studies (waarbij patiëntenkarakteristieken nog nauwkeuriger worden vastgelegd dan in de dagelijkse praktijk) de vastgelegde gegevens minder voorspellend waren voor de uitkomst van de patiënt dan de niet-vastgelegde gegevens. In gewoon Nederlands: er klopt maar heel weinig van de voorspelling van de uitkomst aan de hand van de gemeten gegevens van de patiënt. U kunt het hier nalezen.

Er klopt maar heel weinig van de voorspelling van de uitkomst aan de hand van de gemeten gegevens van de patiënt

Ook is het bedenkelijk dat ‘kwaliteit’ gelijkgesteld wordt met ‘geen tweede operatie/ingreep’. Onzin natuurlijk en het geeft een perverse prikkel om patiënten niet opnieuw te opereren. Maar ja, aan de NHR zijn de wetenschappelijke verenigingen van de cardiologen en hartchirurgen verbonden en daar zitten ook knappe wetenschappers, dus reden genoeg voor mij om aan mijn inzicht te twijfelen. Om die reden heb ik direct meerdere collegae geraadpleegd, onder andere collega Harm-Jan de Grooth (eerste auteur van het artikel) en een collega die onderzoek heeft gedaan naar het effect van financiële prikkels op de kwaliteit van zorg in het buitenland. Deze blog is dan ook de vrucht van ons gezamenlijke overleg. Neemt u mij niet kwalijk dat er nu iets meer jargon in de blog staat, maar het is bedoeld om de potentiële patiënten, u en ik wellicht, munitie te geven om hiertegen in opstand te komen.

Menzis ziet geen aanleiding om te vrezen dat hoog-risicopatiënten minder toegang krijgen tot zorg omdat in het vergelijkingsmodel ‘rekening wordt gehouden met de zorgzwaarte van patiënten’. Hiervoor is dan natuurlijk wel een betrouwbare indicator nodig die de verschillen in zorgzwaarte tussen patiënten betrouwbaar meet en inzichtelijk maakt. Maar helaas, voor het risico op complicaties na een dotterprocedure of hartoperatie bestaat er – de marketing van Menzis ten spijt – geen betrouwbare indicator van zorgzwaarte. Dat blijkt uit hun eigen gegevens van Meetbaar Beter, de voorloper van de Nederlandse Hart Registratie.

Voor bijvoorbeeld het voorspellen van het risico op een re-interventie na een dotterprocedure is met de gegevens van 83.000 patiënten een model ontwikkeld dat rekening houdt met 12 patiënt-gerelateerde factoren [Meetbaar Beter Boek 2017 p.55]. Een indruk van de betrouwbaarheid van dit voorspellingsmodel krijgen we door te kijken naar de c-statistic van 0.63, door Meetbaar Beter optimistisch geduid als ‘matig’. In de reguliere wetenschappelijke literatuur zou een voorspellingsmodel met een c-statistic van 0.63 geclassificeerd worden als poor, dus ‘pover’ of ‘onvoldoende’ en zelfs op de grens van failure (<0.60). Het voorspellingsmodel voor het optreden van een hartinfarct na een dotterprocedure presteert al even slecht (c-statistic 0.64) [Meetbaar Beter Boek 2017 p. 54]. In gewoon Nederlands: dat voorspelmodel is onbruikbaar.

Is er dan een beter model denkbaar? Nee, betere modellen om te rekenen met zorgzwaarteverschillen liggen niet binnen handbereik. Ook met extra patiënt-gerelateerde variabelen en met de toepassing van geavanceerde machine-learning technieken verbetert de c-statistic slechts 2 procent. In de methodologische verantwoording concludeert Meetbaar Beter daarom terecht dat “de huidige data niet toereikend [zijn] om op individueel patiëntniveau goed genoeg te kunnen voorspellen” [Meetbaar Beter Boek 2017 p. 187]. En ook de groepen zullen niet groot genoeg zijn om verschillen aan te tonen. Hoe Menzis toch op een betrouwbare manier rekening gaat houden met zorgzwaarte is een raadsel.

Voor uitkomsten op lange- en middellange termijn zijn ongemeten of onmeetbare patiënteigenschappen zoals sociaaleconomische status of leefgewoonten waarschijnlijk even belangrijk als ‘harde’ factoren zoals leeftijd of diabetes. Wanneer deze ongemeten factoren ongelijk verdeeld zijn over verschillende ziekenhuizen, ontstaan er kunstmatige verschillen in meetbare kwaliteitsindicatoren. Dit probleem wordt concreet als we een blik werpen op de 1-jaarsmortaliteit na een dotterbehandeling in de kleinere cardiologische interventiecentra [Meetbaar Beter Boek 2017 p.58]. De centra die slechter presteren dan verwacht, staan in steden en wijken met een lager gemiddeld inkomen dan de centra die beter presteren dan verwacht (Venray, Rotterdam zuid en Tilburg versus Hilversum en Alkmaar), hoewel alle centra nog binnen de foutmarge presteren.

Het is lovenswaardig dat ziekenhuizen zichzelf de maat nemen door deel te nemen aan initiatieven als Meetbaar Beter en de Nederlandse Hart Registratie, ofschoon een discussie over de daadwerkelijke opbrengst versus de kosten nog wel gevoerd mag worden. De slecht presterende modellen om te corrigeren voor zorgzwaarte zijn wellicht beter dan kale vergelijkingen. Maar kritische zelfstudie is iets fundamenteel anders dan de beloning-naar-prestatie die Menzis nu voorstaat.

Het is volstrekt onduidelijk hoe Menzis op een betrouwbare manier denkt te kunnen corrigeren voor zorgzwaarte als experts op dit gebied concluderen dat de meetbare gegevens gewoonweg niet toereikend zijn complicatierisico’s op een valide manier te voorspellen. Daarnaast zal deze methode van zorginkoop voor extra administratiedruk zorgen, om nog maar te zwijgen over de mogelijkheden om het systeem te manipuleren. In Engeland zijn gevallen bekend waarbij dure consultants zich specialiseren in het zodanig coderen en aanleveren van data dat gestandaardiseerde kwaliteitsindicatoren op magische wijze verbeteren.

Hoe is het voor de patiënt gunstig om een slecht presterend ziekenhuis financieel te korten?

Tenslotte is het onduidelijk welke beslissingen Menzis denkt te kunnen sturen met deze methode. Hoe is het voor de patiënt gunstig om een slecht presterend ziekenhuis (als die al geïdentificeerd kan worden, quod non) financieel te korten? Van vrije ziekenhuiskeuze kan geen sprake zijn als je met een acuut hartinfarct in een gillende ambulance naar het dichtstbijzijnde interventiecentrum wordt gereden. Jammer dat nu net in dát ziekenhuis de verpleegkundige bezetting op de hartbewaking tekortschiet omdat Menzis strafkorting heeft uitgedeeld op basis van een bewezen onbetrouwbaar kwaliteitsmodel. En dan zeg ik nog even niets over het grote risico van selectie-bias, dus de dokter wil liever geen hoog-risicopatiënten meer behandelen. Niet omdat het medisch gezien een slechte keuze is, maar omdat het slecht is voor de financiën van het ziekenhuis. Snel ophouden met dit initiatief is dan ook ons wetenschappelijk onderbouwd advies.

Delen