De terugkeer van de ‘Magic Box’
In mijn decennia in deze sector heb ik één constante gezien: de drang om complexe problemen op te lossen met een nieuwe laag abstractie die niemand echt begrijpt. Vandaag noemen we die laag ‘AI-agents’. Het belooft de wereld: geef een opdracht in natuurlijke taal en de agent regelt het. Maar wie de geschiedenis van software engineering kent, ziet de bui al hangen. We ruilen deterministische logica in voor statistische waarschijnlijkheid, en we noemen het vooruitgang.
Het debug-moeras
Op Hacker News zie je de nuchtere geluiden al tussen de opgewonden posts door sijpelen. Ontwikkelaars vragen zich terecht af: hoe test je dit? Hoe schrijf je een unit test voor een systeem dat bij elke run een ander pad kan kiezen? De werkelijkheid is dat we een enorme technische schuld opbouwen. Wanneer een agent een fout maakt in een keten van acties, is het achterhalen van de ‘root cause’ nagenoeg onmogelijk. We bouwen systemen die ‘meestal’ werken, en in de echte wereld is ‘meestal’ simpelweg niet goed genoeg voor serieuze infrastructuur.
De kosten van autonomie
Laten we het over de werkelijke kosten hebben. Niet alleen de tokens, hoewel die bij complexe agent-loops snel in de papieren lopen, maar de onderhoudbaarheid. Een agent is afhankelijk van een model dat door een derde partij wordt geüpdatet. Eén kleine verschuiving in de gewichten van het onderliggende LLM en je zorgvuldig geformuleerde ‘agent-instructies’ zijn waardeloos. We geven de controle over onze stack weg aan partijen die geen enkele garantie bieden op lange-termijn stabiliteit.
Terug naar de basis
Innovatie is prachtig, mits het een fundamenteel probleem oplost zonder drie nieuwe te creëren. De huidige agent-hype lijkt vooral een oplossing op zoek naar een probleem. Voor 90% van de workflows is een goed ontworpen API en een solide UI nog steeds superieur. Het is misschien minder ‘sexy’ dan een pratende robot die je bestanden beheert, maar het werkt tenminste nog als de API-server van de model-provider een slechte dag heeft. Laten we stoppen met het najagen van deze glimmende objecten en weer gaan bouwen aan systemen die we daadwerkelijk kunnen begrijpen en onderhouden.