Nieuwe kernvragen voor toezicht
Volgens columnist Henk ten Voorde zitten bestuurders nog te vaak ‘gezellig op de achterbank’, als het gaat om AI. We hebben niet door dat we ons in een autonoom en ‘zelfrijdend’ voertuig bevinden, dat ons brengt naar een bestemming waarvan we niet eens wisten dat die locatie ooit zou kunnen bestaan. 'Gedraagt AI zich wel menselijk en wenselijk?’
Er zijn drie majeure ontwikkelingen op AI gebied. Als eerste de investeringen in AI-bedrijven, vooral in de VS en Azië, zijn astronomisch. OpenAI (van ChatGPT) haalde in maart bijvoorbeeld nog eens tien miljard dollar op, waardoor hun totale investeringskapitaal nu 120 miljard USD bedraagt. Enorme bedragen met de belofte van een enorme impact en dito belangen en winsten indien AI succesvol vermarkt kan worden. Minstens zo relevante ontwikkeling is de update van de AI-modellen. Bijvoorbeeld op 5 februari 2026 van de GPT-5.3-Codex. Dit model markeert een fundamentele verschuiving: AI die niet alleen gebruikt wordt, maar actief meewerkt aan zijn eigen ontwikkeling. OpenAI gaf expliciet aan dat vroege versies van het model werden ingezet om zijn eigen training te debuggen, implementaties te beheren en testresultaten te analyseren . Met andere woorden: het systeem fungeerde deels als ontwikkelaar van zichzelf. Het betekent dat de scheidslijn tussen ‘bouwer’ en ‘gebouwde’ vervaagt. AI-systemen worden niet alleen complexer, meer dan dat: ze beïnvloeden hun eigen evolutie. Dit vergroot niet alleen de snelheid van ontwikkeling, maar ook de ondoorzichtigheid en potentiële onvoorspelbaarheid. De vraag wordt daarmee urgenter: als systemen mede hun eigen gedrag vormgeven, in hoeverre houden wij -als mens en als toezichthouder- daar nog effectief toezicht op?
Waarden en grenzen
Derde recente en veelzeggende casus is de confrontatie tussen Anthropic (maker van Claude.ai) en de regering van Donald Trump. Samengevat, Anthropic weigerde expliciet om de veiligheidsbeperkingen (guardrails) van zijn AI te versoepelen voor militair gebruik, met name rond massale surveillance en autonome wapens. Dit leidde tot een directe politieke reactie: de regering bestempelde het bedrijf als veiligheidsrisico en verbood federale instanties om de technologie nog te gebruiken. Trump deed daar een schepje bovenop, reageerde scherp en noemde het bedrijf ‘radicaal’, terwijl hij stelde dat de overheid de technologie alleen voor ‘legitieme doeleinden’ zou inzetten. Een zijstapje, natuurlijk weten we maar al te goed welke ‘mooie’ resultaten de combinatie van potentieel intrusieve technologie, overheden, legitimiteit en een zekere politieke agenda opleveren. Wat deze Anthropic-casus bijzonder maakt, is dat het conflict niet ging over technische prestaties, maar over waarden en grenzen: wie bepaalt wat AI wel en niet mag doen? Het laat zien dat AI-systemen en hun ‘ingebouwde normen en waarden’ inmiddels onderwerp zijn van geopolitieke en bestuurlijke strijd op het hoogste niveau.
Wat zegt dat precies?
Drie recente AI-ontwikkelingen dus: toenemend financieel gewicht & belang, gewijzigd technisch paradigma & politiek middel. AI staat in het middelpunt van onze tijd en zal de komende jaren de aandacht blijven opeisen. Hoe beïnvloedt datgene wat wij weten over wat AI allemaal kan en vooral hoe AI het doet ons perspectief op de wijze waarop wij zelf toezichthouden? In hoeverre bevindt zich dat perspectief op een kantelpunt? Waarom zo diep hierover nadenken, hoor ik sommigen van ons fronsend denken? Nou, als we de kwestie plat slaan: AI evolueert momenteel praktisch logaritmisch, dus razendsnel, van hulpmiddel tot handelende speler die niet alleen kan, maar ook wil. Indien wij ons niet vroegtijdig, bewust en waardegedreven gaan verhouden tot AI als steeds groter wordende beslisfactor in ons bestaan en daarin ons perspectief niet mee blijven ontwikkelen, zitten we spreekwoordelijk ‘gezellig op de achterbank’, terwijl we niet doorhebben dat we ons in een autonoom en ‘zelfrijdend’ voertuig bevinden, die ons brengt naar een bestemming waarvan we niet eens wisten dat die locatie ooit zou kunnen bestaan.
Kern: het verschil tussen capaciteiten en neigingen
Het onderscheid tussen capaciteiten en neigingen is cruciaal om AI goed te begrijpen. Capaciteiten gaan over wat een systeem kan: informatie analyseren, teksten genereren, scenario’s schetsen en beslissingen ondersteunen. Neigingen daarentegen gaan over wat een systeem wil of waardeert binnen de taak, de richting waarin het diens capaciteiten inzet. Dat AI ook het laatste element zelfstandig op gaat pakken en gaat beslissen, wordt steeds duidelijker. Het bewijs wordt zichtbaar in recente studies en regelgeving:
- Onderzoek van Max Planck Institute wijst uit dat grote taalmodellen soms eigen morele preferenties tonen, bijvoorbeeld neigingen om bepaalde standpunten actiever te verdedigen of menselijk gezag te betwisten.
- Kern: hoe zal de toenemende afhankelijkheid van mensen van AI/LLM’s diens meningen over belangrijke morele en maatschappelijke beslissingen beïnvloeden?
- Sinds begin maart 2026 verbiedt de EU AI Act volledig geautomatiseerde triage zonder menselijke oversight, vanwege ethische risico's bij efficiëntie-versus-empathie.
- Kern: dit illustreert hoe capaciteiten morele neigingen kunnen maskeren. We willen geen AI-triagesysteem dat onbedoeld efficiënte doorstroom zwaarder laat wegen dan empathische zorg. De capaciteit is dan medisch correct, de neiging technisch rationeel, maar menselijk problematisch.
- Onderzoek van Stanford wijst uit dat het vleiende, behagen zoekende, bevestigende gedrag van AI is ontworpen om de gebruikersbetrokkenheid te vergroten en daarmee risico’s vormt naarmate mensen steeds vaker advies zoeken over interpersoonlijke dilemma's.
- Kern: tijdens interpersoonlijke conflicten waren bijna 50% van de AI-reacties vleiender (sycophantic) dan de reacties van mensen op de menselijke verteller/klager, zelfs wanneer deze verteller zich bezighielden met onethisch, illegaal of schadelijk gedrag. De vertellers gaven de voorkeur aan en vertrouwden slijmerige AI-reacties meer, wat AI-ontwikkelaars stimuleert om de vleierij te behouden ondanks de risico’s en de groeiende kloof met de ‘echte‘ realiteit.
- Tijdens onderzoek van de Universiteit van Pennsylvania vonden de onderzoekers problematische en vaak schokkende waarden in AI, ondanks bestaande controlemaatregelen. Voorbeelden: AI’s die zichzelf belangrijker vinden dan mensen of zich specifiek als ‘anti-‘ positioneerden ten opzicht van bepaalde personen of bevolkingsgroepen.
Potentieel ingrijpender dynamieken
Het hart van AI zoals wij dat nu kennen wordt gevormd door de LLM’s, de grote taalmodellen. Deze modellen zijn getraind op enorm grote hoeveelheden door mensen geschreven teksten. Hierdoor kunnen de LLM’s bepaalde menselijke vooroordelen vertonen omdat de LLM’s deze menselijke vooroordelen ‘gedachteloos’ op hebben genomen in hun kennisbestanden. Dit zijn neigingen om specifieke prikkels, ideeën of groepen boven anderen te verkiezen, iets wat afwijkt van neutrale objectiviteit. De risico’s van AI verschuiven van zichtbare fouten naar minder tastbare, maar potentieel ingrijpendere dynamieken. Naast bekende AI-risico’s zoals bias en onjuiste output, ontstaat een nieuwe categorie: systemen die doelen optimaliseren op manieren die niet volledig aansluiten bij menselijke waarden. Dit kan leiden tot ongewenst, manipulatief of moeilijk verklaarbaar gedrag. Simpel samengevat, de traditionele AI-risico’s zoals privacy, datalekken, fouten en hallucinaties worden aangevuld door een nieuwe categorie met risico’s, de afstemmingsrisico’s:
- eigen doeloptimalisatie door AI-systemen;
- onbedoelde strategieën door AI-systemen;
- manipulatief gedrag door AI-systemen.
Voorbeelden van algemene AI-afstemmingsrisico’s:
- Systemen die output aanpassen om doelen te maximaliseren
- Onbedoelde prioritering van systeemdoelen boven menselijke belangen
Waarom is deze categorie AI-risico’s van een ander kaliber?
Afstemmingsrisico’s onderscheiden zich fundamenteel van traditionele AI-risico’s: het gaat niet om falen, maar er om dat AI-systemen zelf richting gaan kiezen en soms zelfs zichzelf of hun doelstellingen aan gaan passen. Waar bias of fouten corrigeerbaar zijn, vertonen autonome systemen eigen prioriteiten, die zijn onvoorspelbaar door toenemende complexiteit. Gedrag wordt diffuus: wie voorziet wat een AI morgen wil en wie is daarvoor verantwoordelijk? Verantwoording vervaagt omdat AI-neigingen onzichtbare strategieën volgen, buiten menselijk zicht en controle om. Voor organisaties betekent dit dat risico’s minder voorspelbaar en minder controleerbaar worden. Voor toezichthouders betekent dit dat toezicht op AI niet kan stoppen bij technische audits of datakwaliteit. N iet alleen kijken naar wat AI-systemen doen, maar vooral naar het waarom en in wiens belang zij handelen.
Voordenken, niet reageren
Wat zijn de governance-implicaties voor leden van een rvt/rvc? Indien AI steeds meer als (semi-)autonome actor met eigen neigingen te werk gaat, dienen we andere vragen te gaan stellen. De toezichthoudende vraag verschuift van ‘Wat levert AI op?’ of ‘Hoe werkt het?’ naar ‘Gedraagt AI zich wenselijk & menselijk?’. Toezichthouders hebben AI-waarden te toetsen tegen de achtergrond en menselijkheid van de organisatiedoelen, anticiperend op AI-eigen gedrag dat efficiëntie boven ethiek stelt.
- Aansprakelijkheid
Bij voor de mens onverwachte AI-neigingen vervaagt aansprakelijkheid. Is het bestuur, de leverancier of ontwikkelaar verantwoordelijk? Dit risico van ‘verantwoordelijkheidsverdamping’ dwingt de rvt/rvc tot expliciete contracten, audittrajecten en escalatieprotocollen om moreel eigenaarschap te borgen.
- Strategische afhankelijkheid
Organisaties leunen op AI voor besluitvorming, klantinteractie en risicobeoordeling, wat strategische snelheid oplevert maar nieuwe kwetsbaarheden creëert. Onzichtbare beïnvloeding via ‘AI-bevooroordeelde’ adviezen of verborgen prioriteiten ondermijnt toezicht. Een logische gedachte is dat rvc’s/rvt’s wensen om afhankelijkheidsgradaties in kaart te laten brengen en de ‘human-in-the-loop” als governance-norm af te dwingen.
Praktische handvatten voor toezichthouders in AI-tijden
Hoe kunnen toezichthouders hier praktisch mee omgaan? Deze ‘voordenk-‘vragen dwingen anticiperend denken vanuit het bestuur af.
- Nieuwe kernvragen voor de RvT
- Aan welke doelen draagt ons AI-systeem echt bij?
- Hoe borgen we dat AI aansluit bij onze kernwaarden?
- Wat als afwijkend gedrag opduikt, wie grijpt in en hoe?
- Uitbreiding van toezichtkaders
De traditionele kaders, zoals compliance en risico, uitbreiden met ethiek en gedragsmonitoring. Herdefinieer AI als zowel een strategische kans als een strategisch risico:
- Toets AI-neigingen systematisch tegen organisatiewaarden.
- Bouw uitlegbaarheid AI-denken in via audits en stress-tests
- Plaats AI structureel op de agenda van audit- en risicocommissies
De bottomline: indien grote taalmodellen waarden en neigingen ontwikkelen die botsen met menselijke maat of morele grenzen, dan vraagt dat om een nieuwe manier van kijken, beoordelen en positioneren van waardegedreven toezichthouden. De inzet van AI is niet waardenvrij, maar gaat blijvend steeds meer terreinen van onze maatschappij en ons leven richting geven en bepalen. Inclusief de organisatie(s) waaraan we onze toezichthoudende dienst aan verlenen.
Henk ten Voorde (Ten Voorde Consultancy) is een ervaren boardroomadviseur op het gebied van organisatie-, leiderschaps-, team- en talentontwikkeling & toezicht houden, waarbij de focus op zowel strategisch als operationeel vlak ligt. Hij heeft ruime ervaring op het gebied van strategische leiderschapsontwikkeling, trainingsmanagement, operationele excellence, change- & performance management in nationale en internationale omgevingen. Gedurende zijn werk aan Universiteit Leiden heeft Ten Voorde een uitgebreide bibliotheek met eigen psychologische testen gevalideerd. Hij verzorgt veel boardroom dynamics-sessies op basis van het werk van professor Graves, grondlegger van Spiral Dynamics, drijfveren, intrinsieke motivaties & Big Five persoonlijkheid.