AI-strategie

Waarom de meeste AI-pilots de productie nooit halen

AI-pilots falen voor 80 procent, niet door de techniek. RAND, Gartner en McKinsey data laten zien waarom, en wat de succesvolle 20 procent anders doet.

AUTEUR

Ralf Klein

Why Most AI Pilots Never Reach Production

Ongeveer 80 procent van de AI-pilots in bedrijven haalt de productie niet. De RAND meta-analyse uit eind 2025 van 65 enterprise AI-projecten komt uit op 80,3 procent. Dat is ruwweg twee keer de faalkans van klassieke software. De reflex is om de techniek de schuld te geven. De data wijst ergens anders heen.

De grote onderzoeksbureaus die dit volgen, komen tot hetzelfde patroon. RAND, Gartner, McKinsey en Stanford hebben in de afgelopen anderhalf jaar cijfers gepubliceerd, en geen van die rapporten legt het probleem bij de modelkwaliteit. De pilots die overleven en de pilots die stranden, draaien op dezelfde onderliggende technologie. Wat hen scheidt, is wat er gebeurde voordat de pilot begon.

De 80 procent is niet één getal

Het samengestelde faalpercentage misleidt, omdat de mislukkingen zich op verschillende momenten ophopen. RAND splitst het uit. Ongeveer 33,8 procent van de AI-projecten wordt afgebroken voordat ze de productie halen. Nog eens 28,4 procent komt wel in productie, maar levert niet de verwachte waarde. En 18,1 procent draait wel, maar verdient de investering nooit terug. Elk van die faalvormen heeft een andere oorzaak, en een andere oplossing.

Afbreken voor productie is meestal een scopingprobleem. Het waardelek erna is meestal een integratie- en adoptieprobleem. De kostenoverschrijding is meestal een infrastructuurprognoseprobleem. Door ze op één hoop te gooien, gaat de les verloren.

Gartner voorspelt dat tot en met 2026 organisaties 60 procent van de AI-projecten zullen afbreken die niet door AI-ready data worden ondersteund. 63 procent van de organisaties heeft niet, of weet niet zeker of zij de benodigde datapraktijken hebben. Dat is de grootste cluster van grondoorzaken in alle onderzoeken.

Wat pilots echt doodt

RAND noemt vijf terugkerende faalpatronen. De eerste is de meest voorkomende: stakeholders begrijpen het probleem niet, of communiceren het verkeerd, en het model wordt geoptimaliseerd op de verkeerde metric. De tweede is ontbrekende of onvoldoende trainingsdata. De derde is technologie-eerst denken, AI kiezen omdat het de nieuwste tool is in plaats van omdat het bij het probleem past. De vierde is het ontbreken van infrastructuur om data te beheren en modellen te deployen. De vijfde is AI toepassen op problemen die het nog niet kan oplossen.

Geen van deze problemen is een modelprobleem. Het zijn allemaal beslissingen die mensen nemen voordat het bouwen begint. Daarom lost een beter model een vastgelopen pilot zelden op. De beperking zit stroomopwaarts.

CIO's analyse van enterprise AI bevestigt dit met een ander cijfer: 88 procent van de AI-pilots haalt de productie niet, maar de grondoorzaak ligt niet bij IT. Het ligt bij governance, eigenaarschap en het gat tussen wat de pilotomgeving toetste en wat de productie écht eist. Pilotdata is gecureerd. Productiedata is rommelig. Pilotgebruikers zijn enthousiaste early adopters. Productiegebruikers zijn de hele werkvloer. De pilot simuleert geen van beide.

Wat de succesvolle 20 procent anders doet

Het Stanford Digital Economy Lab onderzocht 51 succesvolle enterprise AI-implementaties in begin 2026. Hun conclusie was dat het verschil tussen snelle wins en jarenlange stilstand nooit het AI-model was. Het was altijd de organisatie. Zelfde technologie, zelfde use cases, totaal verschillende uitkomsten.

Drie patronen komen terug bij de succesvolle 20 procent. Ten eerste is het probleem smal en al gedocumenteerd. Bedrijven die slaagden, kozen een use case waar het werk herhaalbaar en meetbaar was, met een duidelijke input en output voordat AI erbij kwam. Zij vonden de workflow niet uit tijdens de pilot. Zij digitaliseerden een bestaande workflow. Ten tweede was er één verantwoordelijke eigenaar. Geen stuurgroep, geen cross-functioneel werkgroepje, maar één persoon met de bevoegdheid om scopingbeslissingen te nemen en de verantwoordelijkheid voor de uitkomst. Ten derde waren succesmetrieken vóór de start gedefinieerd. Industrieonderzoek uit 2026 laat zien dat 73 procent van de gefaalde AI-pilots geen duidelijk gedefinieerde succesmetrieken had bij de start. De pilots die opschaalden, hadden ze op dag één op papier.

Het patroon strekt zich uit tot workflow-herontwerp. McKinseys State of AI rapporteert dat top performers bijna drie keer zo vaak workflows herontwerpen rondom AI als andere bedrijven. 55 procent van de top performers herontwerpt de manier waarop het werk loopt. Bij de rest is dat slechts 20 procent. AI vastplakken op een bestaand proces conserveert meestal juist de inefficiëntie die je wilde verwijderen.

De kostenvraag heeft een specifieke vorm

Ook pilots die wel in productie komen, sneuvelen daar vaak alsnog. De 18,1 procent die draait maar de investering nooit terugverdient, heeft een herkenbaar profiel. Infrastructuurkosten lopen op productie-schaal doorgaans drie tot vijf keer hoger uit dan de initiële schatting, omdat pilotomgevingen verbruikspatronen verbergen die pas onder echte belasting opduiken. Cloud-uitgaven explodeert. Monitoring- en kwaliteitscontroletools worden achteraf tegen premium prijzen toegevoegd. Compliance- en auditwerk dat tijdens de pilot was uitgesteld, wordt in productie verplicht.

De oplossing is geen goedkoper model. Het is productiekosten doorrekenen op basis van pilotpatronen voordat je groen licht geeft voor de opschaling. Succesvolle teams bouwen een kostenmodel dat data-refresh, monitoring, hertraining, governance en integratie-onderhoud meeneemt, en toetsen vervolgens de business case op dat volledige bedrag. De meeste mislukte projecten toetsen de business case op pilot-economie.

Wat te doen voor je volgende pilot

De data convergeert op een korte pre-pilot checklist. Voordat je een pilot goedkeurt, schrijf het specifieke probleem op in één zin, met de metric die zal vertellen of het is opgelost. Identificeer de ene eigenaar met de bevoegdheid om te leveren en de verantwoordelijkheid voor de uitkomst. Audit de data die het model gaat consumeren, niet in de gecureerde pilotversie, maar in de vorm waarin die in productie binnenkomt. Bereken de volledige kosten op productie-schaal, niet op pilot-schaal. En committeer aan het herontwerpen van de workflow als de pilot slaagt, in plaats van AI op de oude te plakken.

Die vijf vragen doden meer slechte pilots dan welke modelvergelijking dan ook. Ze sturen de AI-uitgaven ook richting projecten die een kans hebben om zichzelf terug te verdienen.

De 80 procent faalkans wordt gepresenteerd als een technologieverhaal. Dat is het niet. Het is bewijs van wat er gebeurt wanneer nieuwe tools botsen met oude organisatiegewoonten. De bedrijven die AI laten werken, behandelen de pilot als de derde stap, niet de eerste. De eerste stap is scoping. De tweede is eigenaarschap. De derde is de pilot zelf. De succesvolle 20 procent is niet beter in AI. Ze zijn beter in beslissen waarop ze AI richten.

BLOG

Andere inzichten

Meer inzichten

Bloxs and AI: Why Tenant Communication Is the Biggest Untapped Win in Property Management

Inzichten

17 apr 2026

Bloxs en AI: waarom huurderscommunicatie de meest onderschatte winst is in vastgoedbeheer

Hoe vastgoedbeheerders Bloxs combineren met AI om huurderscommunicatie te automatiseren, en wat de cijfers zeggen over adoptie, ROI en wat echt werkt.

Inzichten

13 apr 2026

Anthropic bouwde een AI die 3.000 zero-day kwetsbaarheden vond. Daarna weigerden ze het model vrij te geven.

Claude Mythos scoort 93,9% op SWE-bench en vond duizenden zero-days, waaronder een 27 jaar oude OpenBSD-bug. Anthropic geeft het niet vrij. Dit is waarom.

Inzichten

10 apr 2026

72% van huurders vertrekt door responstijd, niet door het onderhoud zelf

AI reageert op onderhoudstickets in 3 minuten. Vastgoedbeheerders doen er dagen over. Dit verschil veroorzaakt 72% van de huurderopzeggingen.

Waarom de meeste AI-pilots de productie nooit halen

Ralf Klein

De 80 procent is niet één getal

Wat pilots echt doodt

Wat de succesvolle 20 procent anders doet

De kostenvraag heeft een specifieke vorm

Wat te doen voor je volgende pilot

Andere inzichten

Bloxs en AI: waarom huurderscommunicatie de meest onderschatte winst is in vastgoedbeheer

Anthropic bouwde een AI die 3.000 zero-day kwetsbaarheden vond. Daarna weigerden ze het model vrij te geven.

72% van huurders vertrekt door responstijd, niet door het onderhoud zelf

[email protected]

+31 682 0545 07