Resultaatbekostiging ggz – het patiëntenperspectief

Een van de meest succesvolle uitvindingen van de psychiatrie en psychologie als empirische wetenschappen is het diagnose-evidence-based-practice-richtlijn-symptoom-reductie-routine-outcome-monitoring model van psychische variatie. Het diagnose-EBP-richtlijn-ROM model projecteert een wereld van maakbaarheid en meetbaarheid, waar je je kunt overgeven aan een professional die je meeneemt in een wereld van objectiveerbaar psychisch ziek zijn en je de technische psycho- en farmacotherapieën aanreikt die elk type lijden meetbaar kunnen remediëren.

Als het er zo technisch aan toe gaat, lijkt het logisch om te veronderstellen dat er natuurlijk grote verschillen bestaan tussen behandelaars. Immers, we weten uit de wereld van bijvoorbeeld de technische prostaatchirurgie dat artsen die gecombineerde PET-CT, state of the art robotchirurgie en scholing in neurosafe werken tot hun beschikking hebben, betere resultaten hebben dan hun collega’s die hier niet mee werken. Als het voor de technische prostaatchirurgie geldt, dan zeker ook voor de technische psychiatrie en psychologie – logisch toch?

Dus wat doe je dan? Wel, je gaat bij alle patiënten die in de ggz komen symptoomlijstjes afnemen voor en na behandeling. Het gestandaardiseerde verschil tussen symptoomscore voor en na behandeling noem je de delta-T. Die sla je op in een landelijke database – geheten de Stichting Benchmark GGZ (SBG). De verzekeraars hebben dan eindelijk de prijs-kwaliteitsinformatie die van de ggz een echte markt kan maken, want behandelaars met een hogere delta-T (meer symptoomreductie) zijn betere behandelaars dan collega’s met een lagere delta-T.

Daar hebben we wel 30 miljoen per jaar voor over, right?

Maar afgezien van de vraag in hoeverre symptoomveranderingen überhaupt relevant zijn voor een beschrijving van het proces van leren omgaan met een psychische kwetsbaarheid, dat over de tijd vaak veel meer een proces is van ‘heal and deal’ dan ‘cure and care’ – hier schreef ik eerder over, zijn er vanuit patiëntperspectief een aantal problemen met de delta-T van SBG.

De patiënt heeft niets te kiezen, want SGB heeft geen gegevens over individuele behandelaars – SGB biedt slechts keuze op het niveau van ‘Parnassia of Arkin’

Ten eerste deze paradox: hoewel SBG bedoeld was om de ‘goede’ van de ‘slechte’ behandelaars te onderscheiden, heeft de database geen enkele informatie over de behandelaar. Deze zit namelijk niet in de database. Vergeten? Met behandelaar bedoel ik: de persoon met wie de patiënt een behandelrelatie aangaat. In de database van SBG is alleen informatie over de AGB-code van de instelling te vinden. Met andere woorden: als in Parnassia 5000 behandelaars werken, staan deze in de SBG allemaal geboekt onder dezelfde AGB-code. Ze zijn de gemiddelde Parnassia-behandelaar. Onderscheid maken tussen behandelaars in Parnassia is dus niet mogelijk, en dat betekent dat de patiënt kan kiezen voor Parnassia (ik geloof dat er 8000 mensen werken) maar niet voor een behandelaar binnen Parnassia. Hoewel SBG theoretisch de mogelijkheid biedt om ook extra gegevens van de ‘primaire’ behandelaar aan te leveren, wordt dit meestal niet verzameld en mag het bovendien niet door de verzekeraar gebruikt worden voor wat dan ook. De patiënt kan er dus niets mee. Het zou bovendien zinloos zijn, want de ‘primaire’ behandelaar is lang niet altijd degene met wie de patiënt een therapeutische relatie aanging. Het enige wat SBG kan zeggen tegen iemand met depressie is hoe de gemiddelde delta-T van de 1000 depressiebehandelaars in Parnassia zich verhoudt tot de 1000 depressiebehandelaars van Arkin. Is er iemand die gelooft dat de persoon met depressie in Den Haag, die gewoon een fijne persoon zoekt met wie het gaat ‘klikken’, zich in Amsterdam gaat laten behandelen vanwege 0.1 verschil in delta-T tussen de 2000 depressiebehandelaars in deze twee instellingen?

Oops – is het behandelingseffect wat anders dan het behandelaarseffect? Waar laat men mij nou op kiezen?

De symptomen van mensen veranderen over de tijd. En… het is zeker zo dat een evidence-based behandeling, uitgevoerd door een hoogopgeleide professional, zoals dat gaat in Nederland, hier aan bijdraagt. Best wel veel zelfs. Dit heet het behandelingseffect. Maar hierin is de zorgverzekeraar die over wil gaan op resultaatvergoeding, niet geïnteresseerd. Wat zorgverzekeraars – en de partijen die mee mogen praten aan de bestuurlijke overlegtafels in de ggz – uit de data denken te kunnen halen, is dat behandelaar A systematisch beter is dan behandelaar B in het uitvoeren van de ggz-behandeling. Dit is het behandelaarseffect. In het voorbeeld over de prostaatchirurgie zagen we dat een dergelijk behandelaarseffect kan optreden, afhankelijk van de beschikbaarheid van ultramoderne diagnostische en chirurgische apparatuur. Maar wat is het equivalent daarvan in de ggz?

Het enige wat SBG betrouwbaar verzamelt, is de instelling AGB-code. Dit betekent dat SBG ten hoogste een eventueel ‘instellingseffect’ zou kunnen vaststellen – de 1000 depressiebehandelaars van Arkin die het gemiddeld systematisch beter of slechter zouden doen dan de 1000 van Parnassia. Naast het feit dat de patiënt echt niet geïnteresseerd is in een keuze tussen mega-instelling A of B – de patiënt wil gewoon een fijne persoon – rijst de vraag in hoeverre het überhaupt waarschijnlijk is dat er in Nederland een betekenisvol ‘instellingseffect’ kan bestaan. Gemiddeld zullen de 1000 behandelaars van Parnassia natuurlijk ongeveer even goed zijn als de 1000 van Arkin.

Omdat het effect van ggz-behandelingen wordt gemedieerd door de therapeutische relatie, verwacht je enig verschil tussen therapeuten, oftewel ook enig behandelaarseffect. De mate van therapeutische relatie is het ggzequivalent van de PET-CT en de robottechnologie bij de prostaatchirurgie. Maar of die therapeutische relatie ontstaat, is niet puur een verdienste van de behandelaar, het hangt af van de klik tussen zorgvrager en zorgverlener, en die zal voor elke behandelaar van patiënt tot patiënt verschillen. Dit maakt dat het behandelaarseffect naar de nul zal neigen in de vergelijking van groepen patiënten tussen verschillende therapeuten, zeker als het met zo’n bot instrument gebeurt als de delta-T. En het instellingseffect zal dus helemaal zwaar naar de nul neigen, omdat het instellingseffect de vraag is in hoeverre verschillen in delta-T tussen Parnassia en Arkin zijn terug te voeren op verschillen tussen de gemiddelde behandelaar in de twee instellingen. Dus de vraag of de 1000 depressiebehandelaars in Parnassia gemiddeld een betere therapeutische relatie opbouwen met groepen patiënten dan de 1000 depressiebehandelaars in Arkin. Gaat dit conceptueel nog ergens over, zult u zich afvragen? Nee, inderdaad, dit slaat nergens meer op.

De enige zekerheid voor de patiënt is dat enig verschil in delta-T tussen Parnassia en Arkin meer te maken heeft met verschillen tussen de patiënten die Parnassia en Arkin komen, dan met verschillen tussen de behandelaars die bij Parnassia en Arkin werken.

Misschien het belangrijkste heb ik voor het laatst bewaard. En dat is dit: zou het kunnen dat verschillen in delta-T door nog iets anders worden veroorzaakt dan verschillen in behandelingseffecten en (overigens niet uit de SBG-data destilleerbare) behandelaarseffecten?

Het antwoord is: ja, en niet zo weinig ook! Dit zit hem namelijk in patiëntfactoren (bijvoorbeeld: etniciteit, SES, schulden, lichamelijke gezondheid, werk, burgerlijke staat, et cetera) ziektefactoren (bijvoorbeeld: mate van chroniciteit, gebruik van alcohol en drugs, comorbide subtiele variatie in autismespectrum, comorbide subtiele persoonlijkheidsvariatie, comorbide subtiele variatie in psychosespectrum, et cetera) en regiofactoren (bijvoorbeeld: sociale cohesie, sociale controle, woonkwaliteit, sociale buffers, sociale deprivatie, sociale stress, et cetera). Onderzoekers weten dat verschillen in maten als delta-T vooral zijn terug te voeren op verschillen in patiënt/ziekte/regiofactoren, tenzij hiervoor in extenso gecontroleerd wordt ( Braithwaite, R. S. (2018). “Risk Adjustment for Quality Measures Is Neither Binary nor Mandatory.” JAMA 319(20): 2077-2078.)

In de praktijk is het echter voor SBG onmogelijk om voor elke patiënt meer te verzamelen dan leeftijd, geslacht en een zeer ruwe SES-maat op basis van de postcode. Hoewel gevraagd wordt om opleidingsniveau aan te leveren, wordt dit slechts bij een minderheid gedaan. Etniciteit wordt ook maar in een kleine minderheid van de gevallen geleverd. Met andere woorden: zelfs als zou SBG willen corrigeren voor de factoren die het meeste impact hebben op verschillen in delta-T scores tussen aanbieders (te weten: patiëntfactoren, ziektefactoren en regiofactoren), dan is dat onmogelijk omdat de data domweg niet voorhanden zijn. SBG heeft vrijwel niets waarmee ook maar een begin kan worden gemaakt van een valide casemix-correctie.

Om het samen te vatten: de patiënt die op zoek is naar een menselijke behandelaar met wie het hopelijk gaat klikken kan in de praktijk kiezen tussen de delta-T van Parnassia of de delta-T van Arkin. Maar dat is natuurlijk helemaal geen keuze: het enige wat de patiënt zeker weet is dat enig verschil in delta-T meer te maken heeft met verschillen tussen de patiënten die bij Parnassia en Arkin komen dan verschillen tussen behandelaars die bij Parnassia en Arkin werken. En is dat het resultaat dat Menzis gaat belonen?

Delen