AIToday Live

S08E58 - De prijsverhoging die je zelf kiest

Aigency by Info Support Season 8 Episode 58

Use Left/Right to seek, Home/End to jump to start or end. Hold shift to jump forward or backward.

0:00 | 13:25

Zonder dat je het doorhebt, stijgt je AI-rekening elke maand een beetje — niet door hogere prijzen, maar door aanpassingen in hoe gebruik wordt gemeten. Anthropic telde dezelfde tekst met een nieuwe tokenizer 35% zwaarder, OpenAI verdubbelde de prijs per token met een zuinigheidsbelofte die in de praktijk niet uitkwam. Beide bedrijven bereiden zich voor op een beursgang, en elke stille prijsverhoging die klanten niet opmerken telt mee op de omzetregel.

Het praktische antwoord is een andere gewoonte: begin met het goedkoopste model en schaal alleen op als de kwaliteit tekortschiet. Van 55 prompts in de podcastproductie draait er maar één op het duurste model — en bij een recente check bleken er nog 11 onnodig zwaar ingesteld.

Morgen kun je je vijf meest gebruikte AI-taken testen op een goedkoper model en kijken waar de kwaliteit écht verschilt.

Onderwerpen

  • Verborgen prijsverhogingen door tokenizer-aanpassingen bij Anthropic
  • Prijsverdubbeling GPT-5.5 en verschuiving naar betalen per token
  • Impact aankomende beursgang op prijsstrategie AI-leveranciers
  • Kostenoptimalisatie door bewust modelkeuze van goedkoop naar duur
  • Praktische inzet verschillende modellen in podcast-productie
Links

Genoemde entiteiten: Anthropic - OpenAI - Microsoft - GitHub Copilot - Google - Simon Willison

Stuur ons een bericht

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Schrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!

1
00:00:02,640 --> 00:00:06,080
Leuk dat je weer luistert naar een korte aflevering van AIToday Live.

2
00:00:06,080 --> 00:00:11,440
Vandaag gaan we het hebben over de prijsverhoging die je zelf kiest.

3
00:00:13,200 --> 00:00:14,239
Dit gebeurt er.

4
00:00:14,399 --> 00:00:16,800
Je opent je AI tool.

5
00:00:16,800 --> 00:00:19,679
En het nieuwste model staat al voor je klaar.

6
00:00:19,679 --> 00:00:21,280
Netjes voorgeselecteerd.

7
00:00:21,280 --> 00:00:27,280
Misschien werk je met ChatGPT, misschien met Claude of Copilot en voor dit verhaal maakt het niet uit.

8
00:00:27,280 --> 00:00:30,880
Je klikt erop zonder erbij na te denken.

9
00:00:31,200 --> 00:00:35,359
Want je wilt er niet achterblijven met een oud model.

10
00:00:35,840 --> 00:00:41,280
En precies daar in dat ene klikje zit de prijsverhoging die je zelf hebt uitgekozen.

11
00:00:42,320 --> 00:00:45,040
Vandaag gaan we het hebben over geld.

12
00:00:45,039 --> 00:00:52,240
Over hoe we betalen voor AI en over een verschuiving die de meesten van ons nog niet doorhebben.

13
00:00:52,800 --> 00:00:55,039
Ik kijk hierbij eerst naar Claude.

14
00:00:55,039 --> 00:00:58,239
Het is het model dat wij intensief voor onze podcast gebruiken.

15
00:01:00,320 --> 00:01:05,759
Anthropic, het bedrijf achter Claude, bracht onlangs Opus 4.7 uit.

16
00:01:06,000 --> 00:01:09,439
Kort daarna alweer 4.8, heel snel achter elkaar.

17
00:01:09,439 --> 00:01:12,719
En op het eerste gezicht lijkt dat goed nieuws.

18
00:01:12,799 --> 00:01:15,839
Betere modellen en we mogen ze ook meteen gebruiken.

19
00:01:15,840 --> 00:01:17,280
Maar er zit iets onder.

20
00:01:17,439 --> 00:01:26,959
Want toen Opus 4.7 verscheen, leek de prijs in de tabel die zij hebben op de website gelijk te blijven aan die van 4.6.

21
00:01:26,959 --> 00:01:32,159
5 dollar per miljoen tokens aan de invoerkant 25 dollar aan de uitvoerkant.

22
00:01:32,159 --> 00:01:33,840
Geen cent verschil.

23
00:01:34,320 --> 00:01:42,320
Wat niet in die tabel staat, maar wel in een kader eronder, is dat Anthropic ook een nieuwe tokenizer heeft ingevoerd.

24
00:01:42,319 --> 00:01:50,159
En even een stapje terug om even uit te leggen wat de tokenizer is, waarom dat zo belangrijk is, namelijk een token een stukje van een woord.

25
00:01:50,159 --> 00:01:54,079
En het is de eenheid waarmee je AI gebruik wordt afgerekend.

26
00:01:54,079 --> 00:01:57,519
Een beetje zoals de kubieke meters op je energierekening.

27
00:01:57,520 --> 00:02:04,079
En die tokenizer is de manier waarop geteld wordt hoeveel van die stukjes jij verbruikt.

28
00:02:04,320 --> 00:02:07,039
Die manier van tellen, hebben zij veranderd.

29
00:02:07,200 --> 00:02:14,640
Het gevolg voor exact dezelfde tekst, telt het nieuwe systeem tot wel 35% meer tokens.

30
00:02:14,640 --> 00:02:19,599
Dus de prijs per token blijft gelijk, maar er gaan meer tokens door de meter.

31
00:02:19,600 --> 00:02:23,599
Dus betaal je tot 35% meer voor hetzelfde werk.

32
00:02:24,079 --> 00:02:29,039
Het is een soort van krimpflatie die we uit de supermarkt kennen.

33
00:02:30,000 --> 00:02:35,120
Hier is het mooiste vanuit het oogpunt van de leverancier, wij kiezen er vrijwillig voor.

34
00:02:35,280 --> 00:02:38,560
Want niemand dwingt je naar het nieuwste model.

35
00:02:38,879 --> 00:02:43,999
We gaan er gewoon naartoe omdat nieuwer toch beter voelt.

36
00:02:44,639 --> 00:02:49,599
En nu denk je misschien: ik heb gewoon een abonnement, ik betaal mijn vaste bedrag per maand.

37
00:02:49,600 --> 00:02:52,160
Wat maakt die manier van tellen mij nu uit?

38
00:02:52,319 --> 00:02:55,919
Dat is een goede vraag en het antwoord verschilt, namelijk.

39
00:02:56,400 --> 00:03:01,360
Heb je een abonnement met een vaste prijs dan zit er een limiet aan je gebruik.

40
00:03:01,359 --> 00:03:06,560
En verstookt het nieuwe model meer tokens, dan ben je simpelweg eerder door je limiet heen.

41
00:03:06,560 --> 00:03:08,720
Je krijgt voor hetzelfde geld minder gedaan.

42
00:03:08,719 --> 00:03:13,279
En op een gegeven moment houdt het op totdat je je nieuwe limiet weer ingaat.

43
00:03:13,760 --> 00:03:20,479
Reken je per token af en dan gebeurt zodra een AI-oplossing of een AI-agent de modellen voor je inzet.

44
00:03:20,479 --> 00:03:22,479
En dan is er geen stopknop.

45
00:03:22,480 --> 00:03:24,400
Dan loopt de meter gewoon door.

46
00:03:24,720 --> 00:03:27,120
Rekening betaalt je organisatie.

47
00:03:27,120 --> 00:03:29,440
Of jij als je je baas bent.

48
00:03:29,439 --> 00:03:38,079
Dus dezelfde opslag van 35% laat zich dus op twee manieren voelen: bij een abonnement als een plafond, dat sneller in zicht komt.

49
00:03:38,159 --> 00:03:44,400
Bij betalen per gebruik als een bedrag, dat elke maand net wat hoger uitvalt dan je had ingeschat.

50
00:03:45,120 --> 00:03:51,760
Nu kun je zeggen, ja, misschien zit die nieuwe misschien zit die nieuwe tokenizer gewoon, omdat het model er beter van wordt.

51
00:03:52,000 --> 00:03:55,039
Dat is ook precies hoe Anthropic het uitlegt.

52
00:03:55,279 --> 00:03:56,560
Het kan ook wel kloppen.

53
00:03:56,560 --> 00:03:59,840
Een betere manier van tellen kan een model slimmer maken.

54
00:03:59,840 --> 00:04:03,360
Maar er is toch iets wat mij in ieder geval doet twijfelen.

55
00:04:03,599 --> 00:04:07,920
De goedkopere modellen, hebben namelijk de upgrade niet gekregen.

56
00:04:09,120 --> 00:04:10,719
Om even uitleg te geven.

57
00:04:10,719 --> 00:04:21,600
Dus Anthropic kent de structuur van modellen met de namen Haiku Sonnet en Opus met Haiku als goedkoopste en Opus als duurste model.

58
00:04:21,600 --> 00:04:26,879
En Claude Sonnet, het middenmodel, staat nog op versie 4.6.

59
00:04:26,879 --> 00:04:32,640
En Haiku, het goedkoopste model, dat in veel gevallen prima werkt, staat zelfs nog op 4.5.

60
00:04:32,639 --> 00:04:36,639
Dus dat ten opzichte van die Opus 4.8.

61
00:04:37,920 --> 00:04:38,960
En beide.

62
00:04:39,200 --> 00:04:40,959
Die Sonnet en Haiku.

63
00:04:40,959 --> 00:04:43,439
Die werken dus nog met die oude tokenizer.

64
00:04:43,439 --> 00:04:47,360
Dus met de oude manier van tellen zonder die 35% opslag.

65
00:04:47,360 --> 00:04:50,759
Met andere woorden, wil je het nieuwste.

66
00:04:50,759 --> 00:04:54,080
Dan kom je dus automatisch bij Opus uit.

67
00:04:54,240 --> 00:04:59,280
Bij Opus betaal je de hoogste basisprijs en de opslag van de nieuwe telling.

68
00:04:59,280 --> 00:05:03,160
En de goedkope modellen blijven op de oude meter staan.

69
00:05:03,160 --> 00:05:04,600
Toeval misschien.

70
00:05:04,600 --> 00:05:06,199
Ik vind het best wel opvallend.

71
00:05:06,840 --> 00:05:08,279
Laat ik het concreet maken.

72
00:05:08,600 --> 00:05:16,600
Neem dus Haiku 4.5 naast Opus 4.8 op papier is dan Opus vijf keer zo duur.

73
00:05:16,600 --> 00:05:26,439
Tel je de nieuwe manier van tellen erbij op, dan word je voor dezelfde tekst bijna, of dan ben je voor diezelfde tekst bijna zeven keer zo duur uit.

74
00:05:27,240 --> 00:05:34,840
En dat verschil verdwijnt volledig uit beeld op het moment dat je klakkeloos het nieuwste model aanvinkt.

75
00:05:35,399 --> 00:05:36,840
Waarom vertel ik je dit?

76
00:05:36,840 --> 00:05:40,920
Omdat ik denk dat we nog maar aan het begin staan van een veel grotere verschuiving.

77
00:05:40,920 --> 00:05:43,960
We gaan namelijk steeds meer per token afrekenen.

78
00:05:43,959 --> 00:05:45,800
Kijk naar wat er gebeurt.

79
00:05:45,879 --> 00:05:54,600
Vanaf één juni stapt Microsoft met GitHub Copilot over op afrekenen per token.

80
00:05:54,600 --> 00:06:01,560
Dus je abonnementsprijs blijft gelijk, maar in plaats van een vast aantal verzoeken, krijg je een potje tegoed dat leegloopt.

81
00:06:01,560 --> 00:06:06,680
Logisch ook, want bij programmeren met AI-agents verstook je razendsnel veel tokens.

82
00:06:06,680 --> 00:06:11,079
En de verwachting is dat Anthropic en Google snel zullen volgen.

83
00:06:11,399 --> 00:06:15,639
En wat mooi is, de ontwikkelaar Simon Willison.

84
00:06:15,960 --> 00:06:19,479
Die heeft dit best wel heel mooi voorgerekend.

85
00:06:19,480 --> 00:06:24,759
Hij betaalt namelijk nu zo'n 200 dollar per maand aan abonnementen.

86
00:06:24,759 --> 00:06:28,520
100 dollar voor een Max-abonnement van Claude.

87
00:06:28,519 --> 00:06:34,600
En ook 100 dollar voor zijn voor zijn OpenAI abonnement.

88
00:06:34,600 --> 00:06:43,000
Maar als hij per token had moeten betalen voor wat hij in een maand verbruikt, was hij ruim 2000 dollar kwijt geweest.

89
00:06:43,000 --> 00:06:44,360
Tien keer zoveel.
90
00:06:44,600 --> 00:06:45,879
Daar zit de kern.
 90
00:06:46,120 --> 00:06:54,920
Het abonnementsmodel is voor de leveranciers namelijk onhoudbaar, omdat de zware gebruikers veel meer verbruiken dan dat ze betalen.
 91
00:06:55,159 --> 00:06:59,240
De leveranciers moeten dus op zoek naar manieren om meer in rekening te brengen.
 92
00:06:59,240 --> 00:07:05,399
En hoe prettig is het dan voor hen dat wij vrijwillig naar de duurdere optie lopen.
 93
00:07:05,720 --> 00:07:13,240
En misschien denk je, dit is het verhaal van Anthropic en mijn tool draait op de GPT-modellen of ik gebruik ChatGPT.
 94
00:07:13,240 --> 00:07:15,560
Maar bij OpenAI speelt precies hetzelfde.
 95
00:07:15,560 --> 00:07:17,320
Alleen wat anders verpakt.
 96
00:07:17,639 --> 00:07:23,079
Waar Anthropic de prijs liet staan en de telling veranderde, deed OpenAI het omgekeerde.
 97
00:07:23,079 --> 00:07:28,760
Dus met de komst van GPT-5.5 eind april verdubbelde de prijs per token gewoon.
 98
00:07:28,759 --> 00:07:34,279
En van 2,5 dollar naar 5 dollar aan de invoerkant en van 15 naar 30 dollar aan de uitvoerkant.
 99
00:07:34,279 --> 00:07:38,839
Dus geen verstopte verhoging dit keer, maar zwart op wit op de prijspagina.
 100
00:07:38,840 --> 00:07:41,160
Het addertje zit in het verhaal eromheen.
 101
00:07:41,159 --> 00:07:48,279
Dus OpenAI die zegt dat het nieuwe model zuiniger is en dat het dus minder tokens nodig heeft voor dezelfde taak.
 102
00:07:48,919 --> 00:07:55,240
De boodschap, ja, de prijs gaat omhoog, maar je verbruikt er minder, dus per saldo valt het wel mee.
 103
00:07:55,480 --> 00:07:56,520
Klopt dat dan?
 104
00:07:56,680 --> 00:08:04,680
Onafhankelijke metingen lieten zien dat de werkelijke rekening bij de overstap naar het nieuwe model met de helft tot bijna een verdubbeling steeg.
 105
00:08:04,680 --> 00:08:10,680
Dus gebruikers melden zo'n 40% hogere kosten, ook al werd het model echt zuiniger.
 106
00:08:11,159 --> 00:08:15,160
De zuinigheid dekt de prijsverdubbeling dus bij lange na niet.
 107
00:08:15,159 --> 00:08:17,319
En de rest van het patroon identiek.
 108
00:08:17,319 --> 00:08:23,319
Dus de goedkopere modellen blijven goedkoper en wie naar het nieuwste model grijpt, betaalt het meest.
 109
00:08:23,319 --> 00:08:28,759
Dus ook OpenAI bracht zijn programmeertool al in lijn met het afrekenen per token.
 110
00:08:28,759 --> 00:08:31,080
Zelfde bestemming andere route.
 111
00:08:31,080 --> 00:08:33,479
Dus de een verstopt de verhoging in de telling.
 112
00:08:33,480 --> 00:08:37,639
De ander zet hem open neer met een zuinigheidsbelofte eromheen.
 113
00:08:37,639 --> 00:08:41,320
Het is dus niet dat dit zomaar bij één bedrijf plaatsvindt.
 114
00:08:41,320 --> 00:08:44,760
Het is de richting waarin de markt beweegt.
 115
00:08:45,399 --> 00:08:49,559
En dan speelt er nog iets op de achtergrond.
 116
00:08:49,559 --> 00:08:58,279
En wat mij betreft, verklaart dat de snelheid waarmee dit allemaal gaat en bedoel ik het uitbrengen van deze modellen.
 117
00:08:58,279 --> 00:09:02,520
Dus zowel OpenAI als Anthropic maken zich namelijk op voor een beursgang.
 118
00:09:02,839 --> 00:09:05,800
Anthropic deed deze maand al een vertrouwelijke aanvraag.
 119
00:09:05,799 --> 00:09:09,480
En OpenAI volgt naar verwachting binnen enkele weken.
 120
00:09:09,480 --> 00:09:13,720
Allebei mikken ze op een notering nog dit najaar.
 121
00:09:13,720 --> 00:09:16,680
En de bedragen zijn echt duizelingwekkend.
 122
00:09:16,840 --> 00:09:23,239
Ze halen miljarden en miljarden dollars op tegen waarderingen die groter zijn dan die van gevestigde reuzen.
 123
00:09:23,240 --> 00:09:27,559
En dat voor bedrijven die nog geen van beide winst maken.
 124
00:09:27,879 --> 00:09:29,559
Daar zit precies wel de spanning.
 125
00:09:29,559 --> 00:09:35,000
Dus wie naar de beurs gaat met zo'n prijskaartje moet natuurlijk toekomstige aandeelhouders iets te bieden hebben.
 126
00:09:35,000 --> 00:09:39,719
Dus je moet laten zien dat er groei in zit, dat je omzet stijgt en dat er een pad naar winst is.
 127
00:09:39,720 --> 00:09:43,399
En dat verklaart voor mij in ieder geval de stortvloed aan nieuwe modellen.
 128
00:09:43,399 --> 00:09:47,680
De ene release naar de andere in een tempo dat we eerder niet zagen.
 129
00:09:47,679 --> 00:09:53,120
Elk nieuw model heeft iets extra's, maar in mijn ogen vooral een verhaal naar de markt.
 130
00:09:54,240 --> 00:10:00,560
Deze leveranciers die zeggen eigenlijk: kijk, we worden steeds beter, steeds onmisbaarder steeds meer waard.
 131
00:10:00,559 --> 00:10:11,360
En elke prijsverhoging die we onderweg kunnen doorvoeren zonder dat de klant wegloopt, is een streepje extra op de omzetregel die straks in de beursprospectus komt te staan.
 132
00:10:12,000 --> 00:10:17,680
Dus zo bezien is die onzichtbare opslag op je tokens niet zomaar een technisch detail.
 133
00:10:17,679 --> 00:10:23,520
Het is een klein radertje in een veel grotere machine die op volle toeren draait richting de beurs.
 134
00:10:24,240 --> 00:10:25,600
Wat kun je hier nou mee?
 135
00:10:25,840 --> 00:10:28,560
Ik vertel je dit niet om je bang te maken voor AI helemaal niet.
 136
00:10:28,559 --> 00:10:31,680
Ik gebruik deze modellen elke dag met plezier.
 137
00:10:31,679 --> 00:10:35,520
Maar ik wil dat je wel met een open vizier kiest.
 138
00:10:36,720 --> 00:10:39,120
En hoe pak je dat dan praktisch aan?
 139
00:10:39,120 --> 00:10:41,519
Nou mijn advies: draai de gewoonte om.
 140
00:10:41,519 --> 00:10:50,480
Dus we pakken nu het nieuwste zwaarste model, omdat het er nu eenmaal staat, begin in plaats daarvan met het goedkoopste model en kijk of dat het werk aan kan.
 141
00:10:50,480 --> 00:10:52,559
Doet het dat dan ben je klaar.
 142
00:10:52,559 --> 00:10:56,799
Doet het dat niet, ja dan stap je dan neem je een treetje hoger.
 143
00:10:57,120 --> 00:11:00,080
Kies je een duur model, dus niet andersom.
 144
00:11:00,879 --> 00:11:03,279
Ik kan dit uit eigen ervaring vertellen.
 145
00:11:03,279 --> 00:11:11,200
Want voor deze podcast gebruiken we een hele set aan prompts voor je moet je denken aan research, productie, analyses en nog veel meer.
 146
00:11:11,519 --> 00:11:15,759
We hebben 55 unieke prompts op dit moment in totaal.
 147
00:11:15,759 --> 00:11:21,920
En wat denk je slechts één daarvan draait op het duurste Opus-model.
 148
00:11:21,919 --> 00:11:24,559
En dan dus nog niet eens op het nieuwste model.
 149
00:11:24,720 --> 00:11:27,760
We gebruiken nog steeds versie 4.6.
 150
00:11:27,759 --> 00:11:34,879
Het overgrote deel 45 stuks van die prompts doet het prima op Sonnet, het middelste model.
 151
00:11:35,039 --> 00:11:39,280
En de overige negen draaien op Haiku, het goedkoopste model.
 152
00:11:39,840 --> 00:11:47,920
En ik moet je zeggen, terwijl ik deze aflevering aan het voorbereiden was, ben ik onze eigen prompts nog eens langsgelopen.
 153
00:11:47,919 --> 00:11:56,080
En ik vond er toen 11 die naar een goedkoper model overgezet kunnen worden, zonder dat de kwaliteit daaronder gaat leiden.
 154
00:11:56,080 --> 00:12:01,360
Dus elf prompts die ik tot nu toe gewoon te zwaar had ingesteld puur uit gewoonte.
 155
00:12:01,920 --> 00:12:05,199
Betekent dit dat je altijd voor de goedkope optie moet kiezen?
 156
00:12:05,200 --> 00:12:06,240
Nee, ik denk het niet.
 157
00:12:06,559 --> 00:12:07,680
Dat is echt mijn punt niet.
 158
00:12:07,840 --> 00:12:12,240
Want er zijn taken waarbij het zwaarste model zijn prijs dubbel en dwars terugverdient.
 159
00:12:12,240 --> 00:12:19,759
Denk aan werk waarbij je echt geredeneerd moet worden, waar misschien één foutje een hoop kost of waar de uitkomst meteen goed moet zijn.
 160
00:12:20,000 --> 00:12:23,600
Die ene prompt van ons die op Opus draait, doet precies zoiets.
 161
00:12:23,600 --> 00:12:26,480
Daar is het verschil het geld ook waard.
 162
00:12:26,639 --> 00:12:29,840
De grens ligt dus niet bij duur is beter.
 163
00:12:29,840 --> 00:12:34,240
De grens ligt bij de vraag of het goedkopere model de taak aan kan.
 164
00:12:34,240 --> 00:12:38,159
En voor verreweg het meeste werk is het antwoord echt ja.
 165
00:12:38,399 --> 00:12:44,720
En voor dat ene stukje waar het echt ingewikkeld wordt, betaal je met een gerust hart voor het beste.
167
00:12:44,960 --> 00:12:50,959
En werk je in een organisatie waar AI in producten of in AI agents zit, hou dan je tokenverbruik in de gaten.

166
00:12:51,120 --> 00:12:55,120
Want de rekening gaat zich anders gedragen dan dat je gewend bent.

167
00:12:55,120 --> 00:12:57,760
Zeker als je straks per token afrekent.

168
00:12:58,319 --> 00:13:00,879
Bewustzijn is hier je beste gereedschap.

169
00:13:00,879 --> 00:13:04,639
Een prijsverhoging die je niet ziet aankomen, kun je niet afwegen.

170
00:13:04,639 --> 00:13:07,520
Eén die je wel doorhebt, wel.

171
00:13:08,480 --> 00:13:10,720
Dank je wel weer voor het luisteren.

172
00:13:10,720 --> 00:13:16,559
En bedenk zoals altijd: AI is niet de oplossing voor elk probleem, maar onmisbaar waar het past.

173
00:13:16,559 --> 00:13:24,879
Tot de volgende.