Over dit experiment — AI-debatten

In dit experiment simuleren we Kamerdebatten met AI om te onderzoeken of voorgestelde democratische maatregelen de kwaliteit van het debat verbeteren. Hieronder lees je hoe de simulatie werkt, waarin de AI-Kamer afwijkt van de echte Kamer, en wat we precies meten.

De opzet van de simulatie

In de AI-simulatie (een digitale kloon van de Kamer) wordt elke fractie vertegenwoordigd door één AI-Kamerlid. Een voorzitter bewaakt de orde en verdeelt de beurten. Per debat behandelen de AI-Kamerleden één voorliggend wetsvoorstel. In totaal zijn er 238 debatten gesimuleerd: zowel wetsvoorstellen die in de echte Kamer al zijn besproken als voorstellen die nog op de agenda staan.

De AI-Kamerleden baseren hun uitlatingen op hun partijprogramma, het coalitieakkoord en hun stemgedrag en spreekstijl in het verleden. Ze zijn zich bewust van hun eigen rol (coalitie of oppositie) en van de rol van de andere fracties.

Verschillen met de echte Kamer

De AI-Kamerleden gedragen zich vergelijkbaar met echte Kamerleden, maar niet identiek. Ze debatteren veel minder emotioneel, omdat ze getraind zijn om instructievast te opereren: ze houden zich aan de instructies en de inhoudelijke documenten. Echte Kamerleden debatteren menselijker en laten zich vaker meevoeren door emoties. Ook treden de AI-Kamerleden minder vaak in herhaling, doordat taalmodellen zinnen woord voor woord afmaken in plaats van een hele zin in één keer te vormen.

Ook bij moties zijn er verschillen. In de AI-Kamer worden in méér debatten moties ingediend, maar zijn er minder debatten met heel veel moties. Moties en amendementen worden vaker overgenomen — 6% in de simulatie tegenover 1% in de echte Kamer. Tot slot treedt de voorzitter in de simulatie veel strenger op, met name tegen onparlementair taalgebruik.

Wat we meten

Het doel van de simulatie is om te meten of de voorgestelde maatregelen de debatkwaliteit verbeteren. We kijken naar de gesprekscriteria — herhaling, ontwijking, ordeverstoring, erkenning en overtuiging — en of een debat een concrete uitkomst heeft. Hiervoor berekenen we een aparte score voor de gesprekscriteria en voor de uitkomsten.

Een maatregel heeft een positief effect als zij hoger scoort op de gesprekscriteria of op de uitkomsten dan de basislijn: een scenario waarin geen enkele maatregel is ingevoerd. We vergelijken dus binnen de simulatie, niet tussen de AI-Kamer en de echte Kamer. Om zuiver te meten richten we ons op de debatten die in de basislijn slecht scoren (een score tussen de 4 en 5); bij goed scorende debatten is de ruimte voor verbetering immers klein. We hebben gecontroleerd dat de maatregelen geen negatief effect hebben op de goed scorende debatten — dat is niet het geval.

De maatregelen

We meten de effectiviteit van vijf maatregelen. Twee daarvan zijn de introductie van een kiesdrempel van 4% (kiesdrempel) en de verlenging van de Kamertermijn van vier naar zes jaar (kamertermijn). Voor elke maatregel vergelijken we de scores met de basislijn om te bepalen of de debatkwaliteit verbetert.