AIToday Live
AIToday Live deelt praktijkverhalen over AI die je direct vooruit helpen in je werk. In een wereld waar AI-ontwikkelingen elkaar razendsnel opvolgen, kiezen wij bewust voor verdieping en praktijkervaring. We bieden een kalm kompas in turbulente tijden.
In deze podcast hoor je professionals uit Nederland en België die openhartig vertellen over hun ervaringen met AI-implementaties. Voorbij de hype en krantenkoppen laten zij zien hoe organisaties écht met AI werken.
Onze gasten delen hun successen én uitdagingen op een toegankelijke manier.
Daarmee helpen we jou om:
- Praktische inzichten te krijgen in wat AI wel en niet kan
- Te leren van de ervaringen van andere professionals
- Concrete ideeën op te doen voor je eigen organisatie
- De grotere lijnen te zien in AI-ontwikkelingen
Iedere maandag een diepgaand gesprek met een gast, gepresenteerd door Joop Snijder (CTO Aigency) en Niels Naglé (Info Support). Elke donderdag deelt Joop in een korte aflevering zijn eigen praktijkervaringen en inzichten.
"AIToday Live is uitgeroepen tot AI Podcast of the Year 2025 en is drie keer genomineerd voor 'De Prijs van Oranje' door de Belgian Podcast Awards en staat op nummer 1 in de lijst van Zomerse luister-inspiratie: podcasts over AI, productiviteit, SEO & meer (Frankwatching, juni 2024)."
Ontdek hoe andere professionals AI succesvol inzetten. Ontvang ook exclusieve content, kijk achter de schermen en blijf op de hoogte van nieuwe gasten via onze nieuwsbrief: https://aitodaylive.substack.com
AIToday Live
S08E59 - Groter is niet altijd beter, het verhaal achter GPT-NL
Use Left/Right to seek, Home/End to jump to start or end. Hold shift to jump forward or backward.
Saskia Lensink, productmanager van GPT-NL bij TNO, bouwde met 13,5 miljoen euro een Nederlandstalig taalmodel waarvan elke zin in de trainingsdata juridisch is gecheckt en traceerbaar is naar de bron.Dat klinkt vanzelfsprekend, maar het kostte anderhalf jaar om die dataset samen te stellen, omdat licentie-informatie bij de meeste beschikbare datasets ontbreekt of AI-training expliciet verbiedt.Het model richt zich op drie toepassingen die samen zo'n 80 procent van het praktische gebruik van Artificial Intelligence in organisaties dekken: samenvatten, versimpelen en RAG, waarbij je vragen stelt aan je eigen documenten in plaats van aan het geheugen van een model.
Voor sectoren als overheid en zorg is dat relevant: een model waarvan de data-herkomst volledig transparant is en dat op Europese servers draait, neemt een concrete drempel weg voor adoptie.Wil je bijdragen of experimenteren: de code staat op GitHub, datasets zijn gedocumenteerd via Hugging Face, en eind 2025 is er een gehoste versie beschikbaar via een API.
Onderwerpen
- De opbouw van GPT-NL met 13,5 miljoen euro budget en de juridisch gecheckte dataset
- De functionaliteiten van het model: samenvatten, versimpelen en RAG
- Digitale soevereiniteit als ontwerpkeuze met Europese infrastructuur en open source code
- De behoefte aan vervolgfinanciering van 135 miljoen euro voor verdere ontwikkeling
- Hoe organisaties en individuen kunnen bijdragen via data of deelname aan haalbaarheidsstudies
- Project: Een verantwoord alternatief op bestaande LLMs - GPT-NL
- Project: GPT-NL: aanleveren van data
- Platform: GPT-NL (GPT-NL)
- Platform: GPT-NL · GitHub
- Organisatie: SURF is de ict-coöperatie van onderwijs en onderzoek | SURF.nl
- Organisatie: Nederlands Forensisch Instituut | NFI - Nederlands Forensisch Instituut
- Organisatie: Ministerie van Economische Zaken en Klimaat | Rijksoverheid.nl
- Organisatie: Ministerie van Binnenlandse Zaken en Koninkrijksrelaties | Rijksoverheid.nl
- Platform: ChatGPT
- Organisatie: PNA Groep
- Platform: Vlam.ai - SSC ICT
- AI-model: Alpaca (dier) - Wikipedia
- AI-model: Frontier AI LLMs, assistants, agents, services | Mistral AI
- Podcast: AIToday Live
- Kaartspel: AI Game Changer - Generative AI editie
Genoemde entiteiten: TNO - ChatGPT - AMD - Chatbot Gem - Ministerie van Binnenlandse Zaken - Mistral - Silo AI - AI Awards - Deepseek - GitHub - Hugging Face - Aaron Mirck
AigencyAigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.
Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).
Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.
Schrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!
1
00:00:00,000 --> 00:00:05,759
Vandaar spreken we met Saskia Lensink, productmanager van GPT-NL bij TNO.
2
00:00:06,759 --> 00:00:11,640
Van huis-uit taalwetenschapper, een studie die ze zelf ooit niets noemde,
3
00:00:11,640 --> 00:00:16,679
staat ze nu midden in de storm van de grootste taaltechnologie-revolutie ooit.
4
00:00:17,480 --> 00:00:24,160
Want TNO bouwt met slechts 13,5 miljoen euro, een eigen Nederlandstalig model.
5
00:00:24,640 --> 00:00:30,199
Volledige soevereiniteit, met data maar van ze zeker weten dat ze die mogen gebruiken
6
00:00:30,199 --> 00:00:34,880
en gebouwd om niet in Amerikaanse of Chinese handen te vallen.
7
00:00:35,880 --> 00:00:44,280
De centrale vraag, wat kun je eigenlijk bereiken als je weet dat je budget 10 keer kleiner is dan wat je nodig hebt?
8
00:00:46,039 --> 00:00:49,640
Joop: Hoi, leuk dat je weer luistert naar een nieuwe aflevering van AIToday Live.
9
00:00:49,640 --> 00:00:52,520
Joop: Ik ben Joop Snijder, head of AI bij Info Support.
10
00:00:52,520 --> 00:00:55,480
Niels: En ik Niels Naglé, Area Lead Data & AI bij Info Support.
11
00:00:55,480 --> 00:01:00,759
Joop: En in de studio zijn we heel erg blij mee, Saskia Lensink van GPT-NL.
12
00:01:01,080 --> 00:01:02,920
Joop: Eigenlijk van TNO moet ik zeggen.
13
00:01:02,920 --> 00:01:05,400
Joop: Maar we gaan het hebben over GPT-NL.
14
00:01:05,400 --> 00:01:07,959
Joop: En met heel veel plezier.
15
00:01:07,959 --> 00:01:10,920
Joop: Maar voordat we beginnen, zou je jezelf eerst willen voorstellen.
16
00:01:11,640 --> 00:01:16,040
Saskia: Saskia Lensink, ik ben productmanager van GPT-NL en ik werk bij TNO.
17
00:01:16,280 --> 00:01:21,720
Saskia: Van huis uit linguïst, taalwetenschapper, en mag me nu de hele dag bezighouden met taaltechnologie.
18
00:01:21,879 --> 00:01:27,720
Joop: Had je dat ooit gedacht toen je dit studeerde dat je het op deze manier zou gaan toepassen?
19
00:01:27,720 --> 00:01:28,920
Saskia: Nee, helemaal niet.
20
00:01:29,000 --> 00:01:33,080
Saskia: Taalwetenschap was altijd een vrij kleine studie, een beetje niche.
21
00:01:33,079 --> 00:01:34,439
Saskia: Waarom zou je je bezighouden?
22
00:01:34,439 --> 00:01:37,560
Saskia: Taaltechnologie, wat een raar thema.
23
00:01:37,880 --> 00:01:43,159
Saskia: En ineens sinds ChatGPT uit is gekomen, is het ineens de technologie waar iedereen het over heeft.
24
00:01:43,159 --> 00:01:45,800
Saskia: Dus ik zit ineens midden in een soort storm.
25
00:01:46,040 --> 00:01:47,400
Saskia: Dat is hartstikke leuk.
26
00:01:47,720 --> 00:01:49,399
Niels: Zie je dat ook terug in de opleidingen nu?
27
00:01:49,399 --> 00:01:52,279
Niels: Ik kan je nog volgen of er veel meer instroom is, inderdaad.
28
00:01:53,879 --> 00:01:59,959
Saskia: Aan de ene kant zie je dat taalwetenschap ook wel wat groter lijkt te worden, maar ook een beetje veranderd.
29
00:02:00,200 --> 00:02:07,799
Saskia: We zijn veel meer bezig met allerlei computationele technieken, dus heel veel met computers, heel veel met rekenen.
30
00:02:07,800 --> 00:02:09,719
Saskia: En je ziet ook dat die taalmodellen.
31
00:02:09,880 --> 00:02:17,719
Saskia: Een taalwetenschapper zijn heel handig, maar het is ook heel handig als iemand engineer is of als iemand kunstmatige intelligentie heeft gestudeerd.
32
00:02:17,960 --> 00:02:20,679
Saskia: Er zijn heel veel vakgebieden die daarin samenkomen.
33
00:02:20,680 --> 00:02:26,039
Saskia: En we hebben eigenlijk over de volle breedte mensen vanuit studieachtergronden bij ons zitten.
34
00:02:27,480 --> 00:02:30,359
Joop: Je zegt, we zitten midden in de storm.
35
00:02:30,360 --> 00:02:33,560
Joop: Waar wordt nog wel wat gesproken over GPT-NL.
36
00:02:33,880 --> 00:02:39,639
Joop: Zou je eerst aan luisteraars kunnen uitleggen die nog niet mee hebben gekregen wat het is.
37
00:02:40,120 --> 00:02:46,599
Saskia: GPT-NL is een taalmodel, een LLM, die wij zelf helemaal vanaf niets af aan het trainen zijn.
38
00:02:46,599 --> 00:02:48,280
Saskia: samen met Surf en het NFI.
39
00:02:48,280 --> 00:02:49,719
Saskia: Dat doen we bij TNO.
40
00:02:49,719 --> 00:02:52,680
Saskia: Het idee is, waarom zou je zo'n taalmodel helemaal zelf bouwen?
41
00:02:52,840 --> 00:02:57,400
Saskia: We vinden het heel belangrijk dat we eigen taalmodellen kunnen bouwen, dus dat we die kennis hebben.
42
00:02:57,400 --> 00:03:04,520
Saskia: Maar we vinden het ook heel belangrijk dat we modellen bouwen die we in eigen handen hebben, soeverein zijn en ook binnen de kaders van de wet vallen.
43
00:03:04,679 --> 00:03:07,799
Joop: En waarom zeg je dat laatste er specifiek bij?
44
00:03:08,439 --> 00:03:09,560
Saskia: Er zijn nogal wat.
45
00:03:09,560 --> 00:03:14,840
Saskia: Kijk, ik ga niet met vingers wijzen, dat doen we niet, maar we zien wel dat er heel veel rechtszaken lopen momenteel.
46
00:03:14,840 --> 00:03:20,520
Saskia: Als het gaat om de herkomst van de data waarop al die grote taalmodellen zijn getraind.
47
00:03:20,520 --> 00:03:22,840
Saskia: Dus worden er nogal wat vraagtekens bij geplaatst.
48
00:03:23,159 --> 00:03:25,960
Saskia: Is daar data gebruikt die wel gebruikt had mogen worden.
49
00:03:26,120 --> 00:03:29,159
Saskia: Zijn er copyrightschendingen, daar zijn veel rechtszaken over.
50
00:03:29,159 --> 00:03:36,039
Saskia: Maar mensen maken zich ook zorgen over de privacy of over de kwaliteit van de data waarop getraind is.
51
00:03:36,039 --> 00:03:38,120
Saskia: En wij willen dat graag helemaal in eigen handen houden.
52
00:03:38,280 --> 00:03:43,640
Joop: Dus jullie weten precies op welke data van wie er getraind is.
53
00:03:43,640 --> 00:03:46,920
Saskia: Precies, en we weten ook zeker dat we die data mogen gebruiken.
54
00:03:46,919 --> 00:03:54,120
Saskia: Want we hebben overal netjes gecheckt of het geschikt is voor AI-trainingen of we hebben om toestemming gevraagd.
55
00:03:54,280 --> 00:03:58,279
Niels: En wat bedoel je met geschikt zijn qua data?
56
00:03:58,760 --> 00:04:03,960
Saskia: Je hebt allerlei datasets die op het internet te vinden zijn, die kun je downloaden.
57
00:04:03,960 --> 00:04:07,799
Saskia: Maar er zit vaak ook licentie-informatie bij, of het is onbekend.
58
00:04:08,120 --> 00:04:14,280
Saskia: En die licentie-informatie vertelt jou of je dat mag gebruiken voor bijvoorbeeld het trainen van een taalmodel.
59
00:04:14,439 --> 00:04:15,880
Saskia: Heel vaak mag dat helemaal niet.
60
00:04:15,879 --> 00:04:21,240
Saskia: Of er wordt op de website van een bedrijf aangegeven in een opt-out bericht zoals dat heet.
61
00:04:21,240 --> 00:04:25,239
Saskia: Deze data mag niet gebruikt worden voor het trainen van AI-modellen.
62
00:04:25,240 --> 00:04:31,159
Saskia: Daar zijn we heel goed op gaan letten om ervoor te zorgen dat er dus niet per ongeluk data in zit die niet gebruikt had mogen worden.
63
00:04:31,159 --> 00:04:33,640
Niels: Het is heel secuur daarop ingaan, was dat lastig?
64
00:04:35,800 --> 00:04:37,080
Saskia: Dat was lastig.
65
00:04:37,080 --> 00:04:42,840
Saskia: We dachten in het begin best wel optimistisch nou, we hebben een paar maanden nodig en dan hebben we dat wel in kan in kruiken.
66
00:04:42,840 --> 00:04:45,560
Saskia: Uiteindelijk zijn we daar echt wel een lange tijd mee bezig geweest.
67
00:04:45,560 --> 00:04:51,800
Saskia: Het heeft ongeveer anderhalf jaar geduurd voordat we de volledige dataset verzameld hadden waarmee we zijn gaan trainen.
68
00:04:51,799 --> 00:04:53,239
Saskia: Het had meerdere redenen.
69
00:04:53,240 --> 00:04:56,599
Saskia: Er zijn meerdere wetten die van toepassing zijn, dus je moet heel goed uitzoeken.
70
00:04:56,599 --> 00:05:00,440
Saskia: Hoe zit dat dan precies, wat wel, wat niet, welke keuzes maak je.
71
00:05:00,520 --> 00:05:02,840
Saskia: Toestemmingvragen kosten ook tijd.
72
00:05:02,840 --> 00:05:14,520
Saskia: En vooral ook omdat we met heel veel data-eigenaren om tafel zijn gaan zitten en gekeken, kunnen we met elkaar een gemeenschappelijke afspraak maken, gemeenschappelijke licentieovereenkomst, die voor iedereen hetzelfde is.
73
00:05:14,840 --> 00:05:17,960
Saskia: En dat kost even wat praten met elkaar, polderen.
74
00:05:17,960 --> 00:05:24,680
Saskia: Maar dat heeft er wel voor gezorgd dat we nu gewoon één afspraakstelsel hebben waar iedereen in mee kan stappen.
75
00:05:24,679 --> 00:05:31,800
Saskia: En dat is ook wel heel prettig, want dat maakt ook dat je niet het gevoel hebt dat bij de ene veel betere deal is gesloten of dat er ander voorrang heeft gekregen.
75
00:05:31,799 --> 00:05:34,120
Saskia: Nee, het is gewoon voor iedereen hetzelfde.
76
00:05:34,640 --> 00:05:42,840
Joop: En stel je stellen de bedrijven of organisaties die data ter beschikking, of krijgen ze er ook nog iets voor terug.
77
00:05:43,159 --> 00:05:45,040
Saskia: Dat ligt aan het type data.
78
00:05:45,039 --> 00:05:46,240
Saskia: Dat even uitleggen.
79
00:05:44,200 --> 00:05:47,680
Saskia: Bijvoorbeeld de Rijksoverheid.
80
00:05:48,000 --> 00:05:54,239
Saskia: We hebben heel veel teksten die gemaakt worden door gemeentes, de ministeries, noem maar op.
81
00:05:54,239 --> 00:05:59,440
Saskia: En dat zijn heel vaak teksten die publiek beschikbaar zouden mogen zijn.
82
00:05:59,760 --> 00:06:04,719
Saskia: Die data, die teksten, denk bijvoorbeeld aan verslagen van raadsvergaderingen.
83
00:06:04,719 --> 00:06:09,840
Saskia: Dat soort data zit er allemaal in en die data mag gewoon gebruikt worden zonder dat daarvoor betaald moet worden.
84
00:06:10,159 --> 00:06:14,640
Saskia: Daarnaast heb je ook data van bedrijven, bijvoorbeeld mediabedrijven.
85
00:06:14,640 --> 00:06:16,560
Saskia: Dat is data die heel veel geld waard is.
86
00:06:16,559 --> 00:06:19,280
Saskia: Er zou je data zou je kunnen kopen.
87
00:06:19,280 --> 00:06:20,480
Saskia: Dat kost heel veel geld.
88
00:06:20,640 --> 00:06:22,080
Saskia: Dat geld hebben wij niet.
89
00:06:22,080 --> 00:06:24,480
Saskia: Dus honderden miljoenen euro's waard.
90
00:06:24,479 --> 00:06:28,400
Saskia: Dus we hebben met die bedrijven en ook met andere bedrijven de afspraak gemaakt.
91
00:06:28,400 --> 00:06:32,640
Saskia: In plaats van dat wij de data kopen, hebben we een kickback constructie.
92
00:06:32,640 --> 00:06:40,640
Saskia: Dus voor ieder stukje geld dat wij verdienen met de verkoop van de commerciële licentie vloeit een gedeelte weer terug naar de rechthebbende.
93
00:06:42,799 --> 00:06:47,999
Joop: En je zegt van voor commerciële licentie zijn er ook andere licenties dan.
94
00:06:48,000 --> 00:06:53,440
Saskia: Ja, we hebben dus een professioneel en commerciële licentie voor bedrijven en professioneel gebruik.
95
00:06:53,439 --> 00:06:56,799
Saskia: En we hebben ook een academische licentie, een onderzoekslicentie.
96
00:06:56,799 --> 00:07:02,479
Saskia: Dus we zorgen ervoor dat onderzoekers in ieder geval gratis gebruik kunnen maken van het model voor onderzoeksdoeleinden.
97
00:07:02,479 --> 00:07:03,840
Saskia: Dat vinden we heel belangrijk.
98
00:07:05,039 --> 00:07:08,320
Niels: De data die erin gaat, waren daar nog bepaalde eisen aan.
99
00:07:08,319 --> 00:07:08,960
Niels: Kwaliteit.
100
00:07:09,120 --> 00:07:10,240
Niels: Hoe heb je erop gelet?
101
00:07:10,319 --> 00:07:12,960
Niels: Want ja, dat is van invloed op het eind eindresultaat.
102
00:07:12,960 --> 00:07:13,840
Saskia: Ja, absoluut.
103
00:07:13,840 --> 00:07:22,400
Saskia: In de ideale wereld heb je een dataset die precies een weerspiegeling is van alles wat er in Nederland gebeurt en alle thema's en alle type taalgebruik.
104
00:07:23,280 --> 00:07:29,119
Saskia: Daar hebben we wel een beeld bij van hoe dat eruit zou moeten zien, maar dat ga je nooit voor elkaar krijgen, dat is heel moeilijk.
105
00:07:29,760 --> 00:07:31,840
Saskia: Maar daar hebben we geprobeerd om op te letten.
106
00:07:31,840 --> 00:07:42,399
Saskia: Het tweede waar we op hebben gelet, is of er geen data in zit van slechte kwaliteit, als in bijvoorbeeld als jij een internetforum leegtrekt, bijvoorbeeld 4chan.
107
00:07:42,640 --> 00:07:46,000
Saskia: Daar staan niet altijd de leukste gezelligste berichten tussen.
108
00:07:46,000 --> 00:07:50,000
Saskia: En hebben we er ook heel goed op gelet dat we dat soort dingen zoveel mogelijk vermijden.
109
00:07:50,000 --> 00:07:52,559
Saskia: Dus aan de ene kant let je heel erg op de kwaliteit van de tekst.
110
00:07:52,640 --> 00:07:55,200
Saskia: Is het geschreven door professionele schrijvers.
111
00:07:55,200 --> 00:08:05,200
Saskia: Aan andere kant wil je er ook wel wat gewoon taalgebruik tussen hebben zitten, maar wel voorkomen dat daar heel veel misinformatie in staat of heel veel haatdragende berichten.
112
00:08:05,200 --> 00:08:06,640
Niels: Klinkt dus aan groot werk.
113
00:08:06,640 --> 00:08:08,320
Saskia: Ja, dat was heel veel werk.
114
00:08:08,880 --> 00:08:09,679
Saskia: Zeker.
115
00:08:09,679 --> 00:08:14,240
Saskia: Maar het fijne is wel, dat is aan de voorkant heel veel werk.
116
00:08:14,239 --> 00:08:18,720
Saskia: Dus je moet heel goed nadenken over welke keuzes maak je, hoe ga je dat inregelen.
117
00:08:18,719 --> 00:08:22,559
Saskia: Dat moet je vervolgens deels automatiseren, dat kun je niet allemaal met de hand.
118
00:08:23,039 --> 00:08:28,960
Saskia: Maar wat we nu dus wel hebben, is een set van protocollen en manieren van werken en heel veel code.
119
00:08:29,280 --> 00:08:31,120
Saskia: Die we gewoon weer kunnen hergebruiken.
120
00:08:31,120 --> 00:08:33,919
Saskia: Dus je kan dit heel goed gaan opschalen en verder uitbouwen.
121
00:08:34,880 --> 00:08:38,480
Joop: En zitten alleen maar Nederlandstalige teksten erin?
122
00:08:38,480 --> 00:08:40,960
Saskia: Nee, er zit voornamelijk heel veel Engels in.
123
00:08:40,960 --> 00:08:42,880
Saskia: Ja, dat was toch noodzakelijk.
124
00:08:43,120 --> 00:08:51,120
Saskia: Kijk, als je naar de grote taalmodellen kijkt over de hele wereld, dan is vaak Nederlands wat daarin zit een vrij beperkt gedeelte van de hele set.
125
00:08:51,120 --> 00:08:55,039
Saskia: Bij ons is dat is dat gedeelte Nederlands een stuk groter.
126
00:08:55,360 --> 00:08:59,599
Saskia: Maar uiteindelijk heb je gewoon heel veel data nodig om ervoor te zorgen dat je model iets kan.
127
00:08:59,599 --> 00:09:04,320
Saskia: Dus we hebben ook heel veel Engelse data nodig gehad om ervoor te zorgen dat die toch goed in het Nederlands is.
128
00:09:04,719 --> 00:09:09,840
Joop: Om eigenlijk taalconstructies te begrijpen, heb je ook andere talen nodig.
129
00:09:10,159 --> 00:09:11,200
Saskia: Dat is heel grappig.
130
00:09:11,200 --> 00:09:17,120
Saskia: We dachten vrij aan het begin dat het nodig was om dezelfde soort talen in zo'n taalmodel te hebben.
131
00:09:17,119 --> 00:09:21,520
Saskia: Dus het Nederlands wordt een beetje beter als je er Deens bij stopt, die talen lijken op elkaar.
132
00:09:21,520 --> 00:09:26,239
Saskia: Maar het lijkt er inmiddels op dat die ieder soort taal enorm bijdraagt aan de kwaliteit.
133
00:09:26,240 --> 00:09:29,760
Saskia: Dus dat zal in de toekomst zullen we ook meerdere talen gaan toevoegen.
134
00:09:29,919 --> 00:09:33,280
Joop: En hoe meet je dan de kwaliteit?
135
00:09:33,520 --> 00:09:35,600
Saskia: Er zijn ook heel veel manieren voor.
136
00:09:35,839 --> 00:09:40,080
Saskia: Je hebt een aantal standaardtests die je aan zo'n taalmodel kunt voorspiegelen.
137
00:09:40,079 --> 00:09:42,159
Saskia: De benchmarks noemen we ze ook wel.
138
00:09:42,159 --> 00:09:50,320
Saskia: Je kan hem bijvoorbeeld een wiskunde examen geven en dan kijken, hoe vaak geeft hij goed antwoord kun je hem een cijfer geven en dan weet je hoe goed die is in wiskunde.
139
00:09:50,319 --> 00:09:54,159
Saskia: Dat is een beetje een flauw voorbeeld, maar zo heb je heel veel van dat soort standaard testen.
140
00:09:54,400 --> 00:10:01,199
Saskia: Die voeren we uit, maar tegelijkertijd, omdat het een standaard test is, zegt dat nog niet zo heel erg veel over hoe het nou in de praktijk werkt.
141
00:10:01,919 --> 00:10:08,880
Saskia: Want ik kan wel een wiskunde examen doen, maar dat gaat jou niks vertellen over hoe goed ik mijn rol bij GPT-NL kan uitvoeren.
142
00:10:08,880 --> 00:10:10,959
Saskia: Daarvoor moet je het echt in de praktijk uitproberen.
143
00:10:10,960 --> 00:10:12,720
Saskia: En dat zijn we nu volop aan het doen.
144
00:10:13,200 --> 00:10:18,880
Saskia: Dan zijn we nu volop aan het doen met een aantal partners en we haalbaarheidsstudies aan het uitvoeren.
145
00:10:18,880 --> 00:10:23,760
Saskia: En vaak weten de partners heel goed waarvoor ze het model willen gebruiken en wanneer het goed genoeg is.
146
00:10:23,760 --> 00:10:30,199
Saskia: Dus we hebben heel vaak standaard evalueren of aangepaste evaluaties gemaakt.
147
00:10:29,120 --> 00:10:34,840
Joop: En kan je wat delen, ik weet niet of je dat mag, van waar het dan nu voor gebruikt wordt.
148
00:10:35,079 --> 00:10:41,240
Saskia: Zeker, ja, we hebben uiteindelijk een stukje geld gekregen van het ministerie van Economische Zaken.
149
00:10:41,240 --> 00:10:42,679
Saskia: 13 en een half miljoen.
150
00:10:42,679 --> 00:10:44,839
Saskia: Met opdracht, ga daarmee een taalmodel maken.
151
00:10:45,000 --> 00:10:46,359
Saskia: Dat was best wel een kluifje.
152
00:10:46,360 --> 00:10:49,080
Saskia: Het is vrij weinig geld als je het vergelijkt met het.
153
00:10:49,640 --> 00:10:53,080
Joop: Ik moet zeggen, toen ik dat voor het eerst hoorde, dan dacht ik echt, jullie zijn kansloos.
154
00:10:53,240 --> 00:10:54,600
Saskia: Ja, dat dachten meer mensen.
155
00:10:55,319 --> 00:10:57,159
Saskia: Laten we toch maar kijken wat er wel kan.
156
00:10:57,559 --> 00:10:58,839
Joop: Top dat je dat gedaan hebt.
157
00:10:59,240 --> 00:11:01,000
Saskia: Toch we een beetje optimistisch voor gaan.
158
00:11:01,079 --> 00:11:04,280
Saskia: En ergens heeft dat ook wel is dat een voordeel geweest.
159
00:11:04,280 --> 00:11:06,520
Saskia: Want dat betekent dat je heel kritisch gaat kijken.
160
00:11:06,520 --> 00:11:11,080
Saskia: Is zozeer naar wat kunnen we, wat vinden we leuk, maar meer wat is er nou noodzakelijk.
161
00:11:11,079 --> 00:11:14,360
Saskia: Dus we zijn heel veel gaan praten, we hebben berekeningen gemaakt.
162
00:11:14,360 --> 00:11:15,880
Saskia: Je kan een beetje inschattingen maken.
163
00:11:15,880 --> 00:11:19,000
Saskia: Als ik zoveel data heb en zoveel tijd en zoveel geld.
164
00:11:19,000 --> 00:11:21,640
Saskia: Dan kan het model ongeveer zo goed worden.
165
00:11:21,640 --> 00:11:25,000
Saskia: En we zijn met heel veel bedrijven en organisaties gaan praten.
166
00:11:25,000 --> 00:11:28,040
Saskia: Stel, wij maken ons eigen soevereine model.
167
00:11:28,039 --> 00:11:31,560
Saskia: Waar zou jij het voor inzetten als je weet dat het niet alles kan.
168
00:11:31,959 --> 00:11:33,480
Saskia: Daar kwam het naar voren.
169
00:11:33,480 --> 00:11:39,560
Saskia: Als we kijken naar een beetje eenvoudige toepassingen van de taalmodellen, dan gaat het om samenvatten van teksten.
170
00:11:39,559 --> 00:11:43,000
Saskia: Dat is grappig genoeg, helemaal niet zo ingewikkeld voor een taalmodel.
171
00:11:43,000 --> 00:11:45,640
Saskia: Daar heb je niet het nieuwste en het beste voor nodig.
172
00:11:45,640 --> 00:11:47,720
Saskia: Zelfde geld voor versimpelen.
173
00:11:47,720 --> 00:11:50,439
Saskia: Dat werd ook heel veel organisaties aangegeven.
174
00:11:50,919 --> 00:11:53,640
Saskia: Het aanpassen van je teksten aan een bepaald publiek.
175
00:11:53,640 --> 00:11:56,440
Saskia: En RAG, het retrieval augmented generation.
176
00:11:56,520 --> 00:11:58,200
Saskia: Of jullie daarmee bekend zijn.
177
00:11:58,360 --> 00:12:01,719
Joop: Maar voor de luisteraars is misschien handig om dat nog even extra uit te leggen.
178
00:12:02,120 --> 00:12:05,799
Saskia: Dus dat is eigenlijk, je combineert een zoekmachine met een taalmodel.
179
00:12:05,799 --> 00:12:11,000
Saskia: En daarmee ga je door je eigen informatie, je eigen documenten heen van je bedrijf.
180
00:12:11,000 --> 00:12:12,280
Saskia: Voor je organisatie.
181
00:12:12,280 --> 00:12:15,400
Saskia: En dan kun je heel veel informatie uit je eigen documenten trekken.
182
00:12:15,400 --> 00:12:19,080
Saskia: Dus je kan vragen gaan stellen over je eigen documenten.
183
00:12:19,159 --> 00:12:26,360
Joop: Ja, en dat zien we, dat zien wij denk ik ook in de markt van wat er heel veel gebeurt.
184
00:12:27,480 --> 00:12:32,679
Joop: Maar dan nog even concreet, want dit zijn dan zeg maar meer een soort van use cases.
185
00:12:33,799 --> 00:12:40,520
Joop: Kun je iets meer vertellen waar het dan nu in die haalbaarheidsstudies, waar het gebruikt wordt, hoe het gebruikt wordt.
186
00:12:40,839 --> 00:12:41,559
Saskia: Zeker weten.
187
00:12:41,880 --> 00:12:47,799
Saskia: Hier gaan die drie kernfunctionaliteiten samenvatten, versimpelen en dat RAG daar richten we ons met name op.
188
00:12:47,799 --> 00:12:54,360
Saskia: Er zijn ook een paar haalbaarheidsstudies, visibility studies, waarin we bijvoorbeeld categoriseren, classificeren.
189
00:12:54,359 --> 00:12:55,719
Saskia: Dus een sentimentanalyse.
190
00:12:55,799 --> 00:12:59,000
Saskia: Hoe blij zijn mensen in dit bericht.
191
00:12:59,000 --> 00:13:02,280
Saskia: We zijn ook aan het kijken of we stukjes kunnen vertalen.
192
00:13:02,280 --> 00:13:05,480
Saskia: Het is ook grappig van het Nederlands naar het Engels of andersom.
193
00:13:05,799 --> 00:13:12,679
Saskia: De haalbaarheidsstudies die we nu doen, zijn met name bij overheidspartijen, maar ook bij een telecomorganisatie.
194
00:13:12,679 --> 00:13:14,599
Saskia: En bijvoorbeeld bij een overheidspartij.
195
00:13:16,120 --> 00:13:17,960
Saskia: Samen met Binnenlandse Zaken.
196
00:13:18,599 --> 00:13:31,240
Saskia: Samen met hen en de makers van chatbot Gem, gemeentechatbot, zijn we aan het kijken, hoe goed zou GPT-NL kunnen werken in die hele stack, in die hele chatbotomgeving voor gemeentes.
197
00:13:31,720 --> 00:13:36,120
Joop: En die Gem draaiden dat denk ik al een tijdje of niet?
198
00:13:36,120 --> 00:13:43,640
Joop: Want dan zouden ze kunnen dan echt dingen naast elkaar leggen en kijken of het beter, slechter of gelijk is.
199
00:13:43,640 --> 00:13:45,720
Saskia: Ja, en dat is het mooie van deze samenwerking.
200
00:13:45,720 --> 00:13:59,080
Saskia: Want Gem bestaat al, al meerdere jaren, dus is al een applicatie, er zijn eindgebruikers en er zit een heel team achter dat precies weet waar ze Gem voor willen gebruiken en wat de eindgebruikers, de gemeentes, verwachten.
201
00:13:59,079 --> 00:14:00,520
Saskia: Dus dat is fantastisch.
202
00:14:00,520 --> 00:14:06,839
Saskia: En we zijn nu samen met hen aan het kijken, kunnen we GPT-NL inzetten en waar gaat het goed en waar gaat het minder goed.
203
00:14:07,079 --> 00:14:09,559
Saskia: En dat is ontzettend nuttig om te weten.
204
00:14:09,559 --> 00:14:10,840
Saskia: En dat is ontzettend nuttig om te weten.
205
00:14:10,839 --> 00:14:11,240
Joop: Oh, sorry.
206
00:14:13,319 --> 00:14:17,159
Saskia: Ja, we zijn dat is ook wel interessant om te zien.
207
00:14:17,159 --> 00:14:20,199
Saskia: Als je kijkt, bijvoorbeeld chatbot Gem, maar ook bij een versimpeling.
208
00:14:20,199 --> 00:14:25,719
Saskia: We hebben ook een applicatie waarbij we versimpelde overheidsbrieven maken.
209
00:14:25,720 --> 00:14:29,079
Saskia: Of dat doet de Binnenlandse Zaken samen met de PNA groep.
210
00:14:29,079 --> 00:14:32,520
Saskia: Wij kijken dan weer naar kan GPT-NL daarin functioneren.
211
00:14:32,520 --> 00:14:37,400
Saskia: En we zien dat bij Chatbot Gem dat hij het voor sommige dingen best wel goed doet, andere dingen niet zo goed.
212
00:14:37,400 --> 00:14:39,640
Saskia: Hetzelfde geldt voor het versimpelen van brieven.
213
00:14:39,879 --> 00:14:43,320
Saskia: We zijn echt nog aan het kijken hoe kunnen we het meeste uit het model halen.
214
00:14:43,319 --> 00:14:45,640
Saskia: Want je moet hem best wel goed uitleggen wat je wil.
215
00:14:45,799 --> 00:14:49,159
Saskia: Je zegt versimpelde brief, doet hij niet zo goed.
216
00:14:49,159 --> 00:14:55,079
Saskia: En als je de standaard prompts gebruikt, die je bijvoorbeeld bij een Mistral model kan inzetten, doet hij het ook niet zo goed.
217
00:14:55,079 --> 00:14:57,239
Saskia: Je moet hem net weer op een eigen manier prompten.
218
00:14:57,240 --> 00:14:59,079
Saskia: Dus dat zijn we volop aan het ontdekken.
219
00:14:59,079 --> 00:15:01,800
Saskia: Terwijl we tegelijkertijd ook het model verder fine-tunen.
220
00:15:01,880 --> 00:15:06,200
Saskia: Dus we leren hem steeds beter hoe die zich in bepaalde situaties moet gedragen.
221
00:15:06,919 --> 00:15:08,040
Niels: En wat komt er bij kijken?
222
00:15:08,039 --> 00:15:10,600
Niels: Ja, ik zou meteen een andere vraag hoor als ik hem daar nog weten.
223
00:15:11,240 --> 00:15:12,280
Niels: Wat komt er bij kijken?
224
00:15:12,280 --> 00:15:13,640
Niels: Dat fine-tunen.
225
00:15:13,640 --> 00:15:14,799
Niels: Hoe doen je dat?
226
00:15:14,799 --> 00:15:19,359
Niels: Want dat vraagt nogal wat, want het houden we dan getraind, je krijgt input van veel verschillende kanten.
228
00:15:19,360 --> 00:15:22,400
Niels: Wat bepaal je wat je wel gaat aanpassen en wat niet.
227
00:15:22,959 --> 00:15:25,120
Saskia: Ja, dat is een hele goede vraag.
228
00:15:25,120 --> 00:15:31,760
Saskia: Ook best een ingewikkelde, om even een simpel voorbeeld te geven, stel, jij stelt een vraag aan een chatbot.
229
00:15:31,760 --> 00:15:43,120
Saskia: Dan kan die chatbot een heel lang en uitgebreid antwoord geven met heel veel terminologie en jargon en heel uitgebreid, en dat is misschien voor een jurist of een expert een heel fijn antwoord.
230
00:15:43,120 --> 00:15:51,840
Saskia: Maar als ik gewoon wil vragen, hoe moet ik een dak moet ik een vergunning aanvragen voor mijn dakkapel, dan wil ik een vrij simpel antwoord en concreet en kort.
231
00:15:51,839 --> 00:15:59,439
Saskia: Dus de eindgebruiker verschillende eindgebruikers hebben verschillende eisen aan de technologie.
232
00:15:59,439 --> 00:16:01,680
Saskia: Dus waar gaan wij dan op optimaliseren?
233
00:16:01,679 --> 00:16:04,159
Saskia: Als je zoveel verschillende eindgebruikers hebt.
234
00:16:04,880 --> 00:16:06,400
Saskia: Dat is een hele lastige idee.
235
00:16:06,559 --> 00:16:09,280
Saskia: Daar kunnen we heel moeilijk een standaard keuze in maken.
236
00:16:09,280 --> 00:16:16,959
Saskia: Dus vandaar ook dat we bij die haalbaarheidsstudies kijken, gaan we er uiteindelijk op uitkomen dat we een aantal versies van GPT-NL hebben.
237
00:16:16,959 --> 00:16:24,400
Saskia: De een misschien geschikt voor bepaalde eindgebruiker, de ander misschien meer geschikt voor een juridisch expert.
238
00:16:24,720 --> 00:16:28,880
Saskia: Of is dat iets wat uiteindelijk door de organisatie zelf nog even gedaan moet worden.
239
00:16:28,880 --> 00:16:33,600
Saskia: Dus we zijn nu vooral aan het kijken, welke data kunnen we hem verder fine-tunen.
240
00:16:33,600 --> 00:16:36,640
Saskia: Dus je hebt algemene sets die hem een beetje beter maken.
241
00:16:36,640 --> 00:16:40,479
Saskia: We kijken ook wat is er nodig om geschikt te maken voor de eindgebruiker.
242
00:16:40,480 --> 00:16:42,320
Saskia: En hoe makkelijk kunnen we dat verder tweaken.
243
00:16:42,319 --> 00:16:49,120
Saskia: Dus het is ook heel erg ontdekken wat welk sausje wat voor soort ingrediënten heb je nodig om er het beste uit te halen.
244
00:16:49,439 --> 00:16:56,000
Joop: En waar ligt dan het moment dat je stopt met fine-tunen en dat je gewoon opnieuw moet gaan trainen.
245
00:16:57,199 --> 00:16:58,719
Saskia: Ja, dat is ook een goede.
246
00:16:58,720 --> 00:17:04,720
Saskia: Kijk, uiteindelijk is de pre-training, dus ja, het voortrainen van het model, dat hebben we nu afgesloten.
247
00:17:04,880 --> 00:17:09,519
Saskia: Da hebben we op dit moment binnen het huidige budget ook geen geld meer om door te blijven gaan.
248
00:17:09,520 --> 00:17:13,280
Saskia: En er lijkt ook een beetje een grens bereikt te zijn van wat we eruit kunnen halen.
249
00:17:13,280 --> 00:17:16,319
Saskia: De grootste winst zit hem nu echt in dat verdere fine-tunen.
250
00:17:16,400 --> 00:17:18,319
Saskia: Dus dat hebben we al wel gezien.
251
00:17:18,640 --> 00:17:24,960
Saskia: En met fine-tunen zijn er zoveel mogelijkheden, zoveel verschillende technieken, dat ontwikkelt zich ook heel snel.
252
00:17:24,960 --> 00:17:29,440
Saskia: Dus daar zijn we continu allerlei experimenten aan in het uitvoeren.
253
00:17:29,839 --> 00:17:31,439
Niels: Ik was nog wel nieuwsgierig.
254
00:17:31,439 --> 00:17:38,080
Niels: Je hebt de constraint van een beperkt aantal hoeveelheid geld ten opzichte van de grote partijen, dat kan als een groot nadeel zien worden.
255
00:17:38,079 --> 00:17:41,200
Niels: Wat was voor jou als jou het voordeel van een kleine budget hebben?
256
00:17:41,200 --> 00:17:42,719
Saskia: Je moet keuzes maken.
257
00:17:42,720 --> 00:17:46,959
Saskia: En dat is ook fijn, want daardoor pak je focus en blijf je ook heel pragmatisch.
258
00:17:46,960 --> 00:17:53,919
Saskia: En ik denk dat dat ook gewoon een grote plaat heel goed is dat we ook heel pragmatisch met deze technologieën omgaan.
259
00:17:54,240 --> 00:17:56,559
Saskia: Groter betekent niet altijd beter.
260
00:17:56,559 --> 00:18:00,959
Saskia: We maken zelf wel eens de vergelijking met stel, je hebt een Ferrari.
261
00:18:01,200 --> 00:18:04,240
Saskia: Prachtige auto, maar daar ga je niet je boodschappen mee halen.
262
00:18:04,240 --> 00:18:05,359
Saskia: Dat is totale waanzin.
263
00:18:05,359 --> 00:18:08,240
Saskia: Dat kan ook op een fiets via.
264
00:18:08,319 --> 00:18:11,839
Saskia: En dat is denk ik ook een beetje de manier waarop we naar AI kunnen kijken.
265
00:18:11,839 --> 00:18:19,039
Saskia: Er zijn gigantisch grote modellen die heel veel energie slurpen en ook veel kosten om in productie te nemen.
266
00:18:19,039 --> 00:18:23,439
Saskia: Maar dat zijn niet altijd het type modellen die je nodig hebt om te bereiken wat je wil.
267
00:18:23,919 --> 00:18:33,520
Saskia: We zijn ook gewoon gedwongen om een beetje pragmatisch en fit voor purpose, heel gericht op de klant te gaan denken en gewoon te kijken wat kan er wel binnen deze mogelijkheden.
268
00:18:33,760 --> 00:18:44,159
Joop: Loop je dan niet ook tegen het verschil van verwachtingen aan, omdat de meeste mensen die kennen ChatGPT of zijn nu met Claude bezig.
269
00:18:44,160 --> 00:18:46,639
Joop: En dat dan de vergelijking wordt gemaakt.
270
00:18:46,640 --> 00:18:47,520
Saskia: De hele tijd.
271
00:18:47,520 --> 00:18:49,119
Saskia: En dat kan ook niet anders.
272
00:18:49,120 --> 00:18:54,799
Saskia: Zelfs het scheelt wel een hoop de mensen die veel met taalmodellen werken.
273
00:18:55,680 --> 00:19:02,799
Saskia: Die voelen vaak ook wel een beetje aan dat ze natuurlijk niet het niveau van een ChatGPT kunnen verwachten.
274
00:19:02,799 --> 00:19:11,199
Saskia: Maar die geven vaak zelf ook aan voor het soort use cases waar ik het model voor inzet, heb ik die performance ook helemaal niet nodig.
275
00:19:11,280 --> 00:19:14,559
Saskia: Het draait ook heel erg om wat voor processen richt je eromheen in.
276
00:19:14,559 --> 00:19:21,919
Saskia: Heel veel modellen moet je uiteindelijk toch nog een klein beetje een zetje geven in de goede richting om ze geschikt te maken voor jouw use case.
277
00:19:22,000 --> 00:19:24,480
Saskia: En je hebt er continu een soort van onderhoud aan.
278
00:19:24,480 --> 00:19:29,280
Saskia: Dus op zich scheelt dat heel erg en we zijn ook heel erg bezig om het continu uit te leggen.
279
00:19:29,599 --> 00:19:36,720
Saskia: Als je echt wil dat we naar een volgende performance boost gaan, dan zullen we gewoon door moeten ontwikkelen en daar moet er een stukje geld bij.
280
00:19:36,879 --> 00:19:46,239
Saskia: Maar op dit moment kunnen we heel veel aanpakken, heel veel van de eenvoudige use cases, die misschien wel 80% van de toepassingen van generatieve AI op dit moment dekken.
281
00:19:47,200 --> 00:19:55,520
Niels: En betekent het ook dat het goedkoper is om te gebruiken daarmee dan de grote modellen, omdat het kleiner en meer gefocust is.
282
00:19:56,079 --> 00:20:02,039
Saskia: We zijn vanuit TNO zijn we ook verplicht om geen ongeoorloofde staatssteun te geven.
283
00:19:59,120 --> 00:20:03,159
Saskia: Dat is ook een bepaald construct.
284
00:20:03,399 --> 00:20:07,399
Saskia: Betekent dat we ook niet zomaar modellen gratis op de markt mogen zetten.
285
00:20:07,399 --> 00:20:09,799
Saskia: Dus daar zijn we ook bepaalde regels voor.
286
00:20:09,799 --> 00:20:12,199
Saskia: We mogen niet de markt gaan verstoren.
287
00:20:12,200 --> 00:20:14,439
Saskia: Dus daar moeten we rekening mee houden.
288
00:20:14,599 --> 00:20:19,719
Saskia: Telijkertijd zijn we ook aan het kijken naar wat kunnen we wel, wat is er mogelijk.
291
00:20:19,720 --> 00:20:25,639
Saskia: En dan kom je er ook heel gauw achter dat dit soort modellen in de lucht houden en aanbieden aan eindgebruikers.
289
00:20:25,639 --> 00:20:27,000
Joop: Ja, dat kost geld.
290
00:20:27,000 --> 00:20:28,520
Saskia: Dat kun je niet gratis doen.
291
00:20:28,760 --> 00:20:33,400
Saskia: En dan ga je ook kijken naar het verdienmodel van de grote jongens over de plas.
292
00:20:33,399 --> 00:20:37,400
Saskia: En dan zie je dat heel veel gebruik voor gefinancierd is.
293
00:20:37,399 --> 00:20:44,280
Saskia: En dat heel veel modellen tegen best wel een lage prijs op de markt worden gezet, maar heel vaak is de kostprijs een stuk hoger.
294
00:20:44,280 --> 00:20:49,319
Saskia: Dus het is ook een beetje de vraag van ja, hoe gaan we daar op goede manier mee om?
295
00:20:49,319 --> 00:20:53,799
Saskia: Dus we proberen om de kosten zo laag mogelijk te houden, maar we moeten daar ook eerlijk over zijn.
296
00:20:53,799 --> 00:20:55,480
Saskia: Ja, het is niet gratis.
297
00:20:55,480 --> 00:20:58,919
Saskia: Ook als je een model ergens wil aanbieden als een API.
298
00:20:58,920 --> 00:21:02,679
Saskia: Het kost ook gewoon rekenkracht om de boel draaiende te houden.
299
00:21:03,240 --> 00:21:05,879
Joop: Zelfs bij de grote jongens zie je al verschil.
300
00:21:06,760 --> 00:21:12,119
Joop: Dat er of functionaliteit weg wordt gehaald in goedkopere abonnementen.
301
00:21:12,119 --> 00:21:14,280
Joop: Dus moet je duurder abonnement nemen.
302
00:21:14,520 --> 00:21:17,799
Joop: Of dat er meer token-based afgerekend gaat worden.
303
00:21:17,799 --> 00:21:25,559
Joop: Ik denk dat als we hier over een jaar zitten, dat die abonnementsvormen die zij nu aanbieden er ook heel anders uitzien.
304
00:21:25,559 --> 00:21:26,840
Saskia: Dat zou heel goed kunnen.
305
00:21:26,839 --> 00:21:29,159
Saskia: Ja, en dat is altijd een afweging die je moet maken.
306
00:21:29,160 --> 00:21:32,280
Saskia: En voor ons belangrijkste is dat we wel overeind blijven.
307
00:21:32,280 --> 00:21:41,320
Saskia: We moeten er gewoon voor zorgen dat we een gezond businessmodel hebben, waardoor we ook door kunnen blijven gaan en niet continu afhankelijk blijven van subsidiestromen.
308
00:21:41,480 --> 00:21:48,680
Saskia: Want dit is technologie die uiteindelijk waarde moet gaan toevoegen, die processen beter moet maken of leuker of in ieder geval efficiënter.
309
00:21:48,680 --> 00:21:51,799
Saskia: Dus dat zou onder de streep geld moeten opleveren.
310
00:21:52,359 --> 00:21:55,719
Joop: En is TNO nou degene die het dan exploiteert?
311
00:21:55,720 --> 00:21:58,360
Saskia: Op dit moment bieden wij dat model inderdaad aan.
312
00:21:58,599 --> 00:22:02,439
Saskia: En dan kijken we inderdaad naar de toekomst toe hoe we dat verder gaan continueren.
313
00:22:02,520 --> 00:22:11,639
Saskia: Wat we heel erg belangrijk vinden vanuit TNO, is dat nu we geld hebben gestopt en hebben gebouwd aan een soeverein taalmodel voor Nederland, voor Europa.
314
00:22:11,640 --> 00:22:14,200
Saskia: Dat het ook echt in Europese handen blijft.
315
00:22:14,200 --> 00:22:17,879
Saskia: En dat is wel een gevaar wat we zien bij heel veel AI bedrijven door heel Europa heen.
316
00:22:17,879 --> 00:22:24,679
Saskia: Op het moment dat ze een beetje succesvol worden, worden ze heel vaak overgekocht door Amerikaanse bedrijven, Chinese bedrijven.
317
00:22:24,680 --> 00:22:26,599
Saskia: Dat is echt iets wat wij willen voorkomen.
318
00:22:26,599 --> 00:22:34,200
Saskia: We willen echt 100% kunnen borgen dat dat niet gaat gebeuren, wie er ook aan het roer staat of wat voor ideeën er ook zijn.
319
00:22:34,760 --> 00:22:36,280
Joop: Wat dat is dan al wel gebeurd.
320
00:22:36,280 --> 00:22:41,399
Joop: Want ik weet wel, er is het de Zwitser die ook hun eigen model hadden gemaakt.
321
00:22:41,879 --> 00:22:43,640
Joop: Zijn die dan nog zelfstandig?
322
00:22:44,520 --> 00:22:47,319
Saskia: Ja, ik weet dat het Alpaca-model is een open source model.
323
00:22:47,639 --> 00:22:50,439
Saskia: Volgens mij ook nog gewoon in Zwitserse handen.
324
00:22:50,440 --> 00:23:03,720
Saskia: Een voorbeeld wat we vaker hebben bekeken, is een bedrijf in Finland, Silo AI, ontzettend mooi bedrijf, ook hele goede krachtige modellen, bieden veel services aan, die zijn toen overgekocht door AMD.
325
00:23:04,520 --> 00:23:05,880
Saskia: En dat vinden we dan jammer.
326
00:23:05,879 --> 00:23:08,280
Saskia: Denken van ja, we zien dat soort voorbeelden veel.
327
00:23:08,520 --> 00:23:14,759
Saskia: Het is heel erg zonde als we met name ook omdat er belastinggeld in is gegaan in het ontwikkelen hiervan.
328
00:23:14,760 --> 00:23:21,799
Saskia: En wil je eigenlijk voorkomen dat je daar met z'n allen aan hebt meebetaald en vervolgens dat je dat soort initiatieven kwijtraakt.
329
00:23:21,799 --> 00:23:24,840
Joop: Is het dan ook de bedoeling dat het zo direct in Nederland blijft draaien?
330
00:23:24,839 --> 00:23:28,119
Joop: Dus dat het ook hier in een soevereine cloud komt.
331
00:23:28,119 --> 00:23:33,000
Saskia: Ja, we willen er sowieso voor zorgen dat het draait in een Europese cloud.
332
00:23:33,720 --> 00:23:38,280
Saskia: Dus het hoeft niet per se een Nederlands bedrijf te zijn, het kan ook een Europees bedrijf.
333
00:23:38,280 --> 00:23:42,439
Saskia: Maar er zijn best wel wat partijen in Nederland actief die dit soort services aan kunnen bieden.
334
00:23:42,440 --> 00:23:47,000
Saskia: Dus we zijn nu ook volop aan het kijken met wie kunnen we samenwerken hoe gaan we dat aanvliegen.
335
00:23:47,000 --> 00:23:51,879
Saskia: Dus we willen wel het gebruik van GPT-NL zo makkelijk mogelijk maken voor iedereen.
336
00:23:52,440 --> 00:23:57,319
Joop: En als het aan de overheid ter beschikking wordt gesteld.
337
00:23:57,960 --> 00:23:59,960
Joop: Hoe betalen zij er dan voor?
338
00:24:00,200 --> 00:24:03,319
Saskia: Nou, ook zij moeten gewoon een commerciële licentie afnemen.
339
00:24:03,640 --> 00:24:08,680
Saskia: Dus commercieel gebruik van het model ter bevordering van een bedrijfsvoering.
340
00:24:10,599 --> 00:24:12,520
Saskia: Dat geldt voor hen net zo goed.
341
00:24:12,839 --> 00:24:19,720
Saskia: Wat wel interessant is, is dat de Rijksoverheid ook veel bezig is met eigen soevereine cloudoplossingen rijkscloudoplossingen.
342
00:24:19,720 --> 00:24:22,599
Saskia: Er zijn er al meerdere partijen.
343
00:24:22,919 --> 00:24:32,520
Saskia: Ook van de overheid zelf, die een middleware oplossing hebben, een hostingplatform hebben Vlam is een belangrijke partner daar.
344
00:24:32,520 --> 00:24:37,800
Saskia: En via hen kunnen we het model straks ook gaan aanbieden aan een grotere groep ambtenaren.
345
00:24:37,799 --> 00:24:41,720
Saskia: Dus we zijn nu in op kleine schaal aan het experimenteren samen met Vlam.
346
00:24:41,760 --> 00:24:44,879
Saskia: Dus zij bieden het model nog niet gelijk aan aan al hun gebruikers.
347
00:24:45,119 --> 00:24:46,559
Saskia: Dat doen we echt in fase.
348
00:24:44,200 --> 00:24:50,240
Saskia: Maar dat is bijvoorbeeld een platform waarop GPT-NL straks kan gaan draaien.
349
00:24:50,879 --> 00:24:53,520
Niels: En bij dat testen, dan gaan jullie kijken waar werkt het goed voor.
350
00:24:53,520 --> 00:24:56,079
Niels: En daar leren jullie van, gaan jullie bijtrainen.
351
00:24:56,079 --> 00:25:03,039
Niels: Hoe delen jullie dat met de eindgebruikers, zodat die ook weten van dit werkt goed, hier moeten we niet voor gebruiken, hoe doen jullie dat?
352
00:25:03,119 --> 00:25:12,000
Saskia: We zijn nu dus in die haalbaarheidsstudies bezig om al deze inzichten te verzamelen, te bundelen en proberen ook zoveel mogelijk voor iedereen ter beschikking te stellen.
353
00:25:12,639 --> 00:25:14,799
Saskia: We bouwen we heel veel kennis daarover op.
354
00:25:14,799 --> 00:25:19,599
Saskia: Dus dat kunnen we dan ook vervolgens weer doorgeven op het moment dat we bij een nieuwe klant aan de slag gaan.
358
00:25:19,599 --> 00:25:27,199
Saskia: Maar uiteindelijk zou je daar wel een soort certificeringstraject voor willen hebben, waarbij je gewoon de kennis bundelt en in een soort vast lespakket aanbiedt.
355
00:25:27,680 --> 00:25:29,760
Joop: Is er een onderdeel?
356
00:25:30,079 --> 00:25:38,159
Joop: Wat voor jullie verrassend is, dat het misschien zelfs wel beter werkt dan bij de concurrenten laten we het zo noemen.
357
00:25:38,799 --> 00:25:43,439
Saskia: Nou ja, het is al fijn dat we, we zijn de enige die een privacy prijs hebben gewonnen.
358
00:25:44,240 --> 00:25:47,199
Joop: De AI award bij Jim Stoltze hebben jullie gewonnen.
359
00:25:47,280 --> 00:25:48,240
Saskia: Ja, dat was echt fantastisch.
360
00:25:48,240 --> 00:25:49,599
Saskia: Dat was wel een mooie erkenning.
361
00:25:49,599 --> 00:25:52,240
Saskia: We hebben namelijk de privacy awards gewonnen.
362
00:25:52,240 --> 00:25:56,399
Saskia: Het feit ook dat we volledig transparant kunnen zijn over welke data erin zit.
363
00:25:56,399 --> 00:26:01,439
Saskia: We hebben onze code ook open source beschikbaar gesteld, dus iedereen kan dat ook bekijken.
364
00:26:01,919 --> 00:26:02,960
Saskia: Dat is fantastisch.
365
00:26:02,960 --> 00:26:13,200
Saskia: En wat ik zelf nog steeds geweldig vind, is dat we met dit budget er in zijn geslaagt om een werkende LLM te maken, die daadwerkelijk ook op een bepaald niveau komt met die taken.
366
00:26:13,440 --> 00:26:19,679
Saskia: We hebben wel gezegd, hij moet minimaal op het niveau van de ChatGPT 3.5, dus zeg maar die eerste versies van ChatGPT.
367
00:26:19,920 --> 00:26:23,039
Saskia: En dat niveau moeten we wel minimaal kunnen halen op die kerntaken.
368
00:26:23,039 --> 00:26:24,319
Saskia: En daar zitten we overheen.
369
00:26:24,319 --> 00:26:26,000
Saskia: Dus dat vinden we echt geweldig.
370
00:26:27,359 --> 00:26:29,839
Joop: Ja, dat is heel knap wat jullie gedaan hebben.
371
00:26:29,839 --> 00:26:33,039
Niels: Wat hebben jullie in dat traject om daar te komen geleerd?
372
00:26:33,039 --> 00:26:35,439
Niels: Dat je graag van tevoren had willen weten.
373
00:26:37,599 --> 00:26:39,520
Saskia: Er zijn heel veel lessen.
374
00:26:41,039 --> 00:26:44,799
Niels: Of er niet eens te zijn, dan mogelijk over praten.
375
00:26:45,599 --> 00:26:51,359
Saskia: Uiteindelijk een beetje geduld hebben, maar ook wel een beetje doorduwen, maar dat hebben we eigenlijk overal wel gedaan.
376
00:26:51,359 --> 00:26:57,520
Saskia: Ik denk dat ik vooral heel trots ben op hoe we toch continu, ondanks dat niet alles makkelijk was, wel door zijn blijven gaan.
377
00:26:57,520 --> 00:27:02,799
Saskia: En ik ben heel heel erg verbaasd over hoe verenigd iedereen er wel achter staat.
378
00:27:02,799 --> 00:27:06,720
Saskia: Iedereen is wel enthousiast, denkt mee, de hele gemeenschap.
379
00:27:06,720 --> 00:27:18,720
Saskia: En dan hebben we het niet alleen over de data leveranciers, maar juist ook over de eindgebruikers en allerlei stakeholders in het veld zo bereid zijn om mee te denken en hier de schouders onder te zetten.
380
00:27:18,720 --> 00:27:20,319
Saskia: Dat is gewoon heel mooi.
381
00:27:20,559 --> 00:27:22,719
Saskia: Het is wel heel lastig om te kijken.
382
00:27:23,200 --> 00:27:26,000
Saskia: We hebben nu laten zien wat we kunnen met dit stukje geld.
383
00:27:26,000 --> 00:27:28,719
Saskia: Dit smaakt naar meer, nu willen we opschalen.
384
00:27:29,039 --> 00:27:31,919
Saskia: En die stap die is ongelooflijk lastig.
385
00:27:32,079 --> 00:27:34,079
Saskia: Er is niet zomaar geld beschikbaar.
386
00:27:34,079 --> 00:27:37,439
Saskia: Je krijgt niet automatisch van de Rijksoverheid weer een check.
387
00:27:37,440 --> 00:27:40,559
Saskia: Dus daar zitten we best wel zitten we nu in een spannende fase.
388
00:27:40,720 --> 00:27:43,679
Joop: En als dat niet komt, dat geld, wat dan.
389
00:27:44,079 --> 00:27:47,679
Saskia: Dan hebben we nu deze productlijn van GPT-NL.
390
00:27:48,000 --> 00:27:50,000
Saskia: Die gaan we zo goed mogelijk maken.
391
00:27:50,000 --> 00:27:54,079
Saskia: Maar dat betekent wel dat je functionaliteiten beperkt zijn.
392
00:27:54,240 --> 00:27:58,959
Saskia: Er zijn gewoon de functionaliteiten die we nu kunnen aanbieden, en er zal dan niet heel veel meer bij kunnen komen.
393
00:27:58,960 --> 00:28:03,840
Saskia: Dus we kunnen niet ineens allemaal agente tool use gaan aanbieden op basis van dit model.
394
00:28:03,839 --> 00:28:08,000
Saskia: We kunnen het model niet ineens in het Frans of in het Turks laten praten.
395
00:28:08,640 --> 00:28:10,639
Saskia: En dan stopt de ontwikkeling een beetje.
396
00:28:10,639 --> 00:28:15,440
Saskia: En dan blijft het model relevant voor komende jaar, twee jaar, misschien zelfs wel drie jaar.
397
00:28:15,440 --> 00:28:17,599
Saskia: Dat is moeilijk om in de toekomst te kijken.
398
00:28:17,839 --> 00:28:20,799
Saskia: Maar uiteindelijk gaat de wereld om je heen verandert.
399
00:28:20,799 --> 00:28:23,679
Saskia: En je wil heel graag wel enigszins kunnen meegaan met die verandering.
400
00:28:23,919 --> 00:28:26,480
Joop: Het zou ook heel pijnlijk zijn voor de ambitie van Nederland.
401
00:28:27,359 --> 00:28:29,280
Saskia: Absoluut, het is ontzettend zonde.
402
00:28:29,439 --> 00:28:38,800
Saskia: Vooral ook als je ziet wat je met beperkte middelen toch ontzettend ver kan komen, dan weet je gewoon dat er heel veel potentie zit in een volgende stap en in verdere opschaling.
403
00:28:39,120 --> 00:28:41,839
Niels: En twee vragen, ik begin op mijn eerste.
404
00:28:41,919 --> 00:28:47,440
Niels: Eerste vraag die bij mij opppopte, was het stukje van stel, je hebt wel het budget en dat was twee keer zo groot.
405
00:28:47,439 --> 00:28:50,639
Niels: Wat zou dan het eerste zijn wat je zou willen laten bouwen?
406
00:28:50,960 --> 00:28:52,879
Saskia: Een huidge budget keer twee.
407
00:28:55,119 --> 00:28:59,519
Saskia: Ja, we hebben wel gezegd, we hebben ongeveer keer tien nodig voor de volgende fase.
408
00:28:59,680 --> 00:29:02,480
Saskia: Dat zijn wel echt even de bedragen waar we aan denken.
409
00:29:02,480 --> 00:29:04,640
Saskia: Maar met een twee keer zo'n groot budget.
410
00:29:04,640 --> 00:29:07,599
Saskia: Nou zouden gewoon onze datastrategie voortzetten.
411
00:29:07,599 --> 00:29:11,680
Saskia: En dan met name denk ik gericht op misschien één of twee extra taalgebieden.
412
00:29:11,680 --> 00:29:14,880
Saskia: Dus dan gaan je niet gelijk heel Europa erbij nemen.
413
00:29:14,879 --> 00:29:19,439
Saskia: Ik denk dat we dan vooral kiezen voor het verbeteren van onze RAG-functionaliteit.
414
00:29:19,919 --> 00:29:26,879
Saskia: Je kan met retrieval augmented generation, kun je je R, je retrieval kun je verbeteren, of je G, je Generation.
415
00:29:26,879 --> 00:29:28,879
Saskia: We kunnen we die retrieval een stukje verbeteren.
416
00:29:29,160 --> 00:29:30,520
Saskia: Daar denken we heel erg aan.
417
00:29:29,200 --> 00:29:32,919
Saskia: We willen ook graag een spraakfunctionaliteit toevoegen.
418
00:29:33,240 --> 00:29:38,119
Saskia: Er zijn best wel wat bedrijven en initiatieven die heel goed bezig zijn met spraaktechnologie.
419
00:29:38,119 --> 00:29:40,599
Saskia: Dus dat verder integreren zou heel mooi zijn.
420
00:29:40,599 --> 00:29:43,000
Niels: En de tweede vraag een beetje in de verlengde van is.
421
00:29:43,000 --> 00:29:50,439
Niels: Wanneer wordt het interessant om het model groter te maken voor een nieuwe variant met dezelfde strategie gaan trainen voor andere doeleinden.
422
00:29:51,559 --> 00:29:53,799
Saskia: Dat is een interessante afweging.
423
00:29:54,039 --> 00:29:59,879
Saskia: Uiteindelijk is daar het belangrijkste wie is bereid of wie zou daarvoor willen betalen.
424
00:29:59,879 --> 00:30:01,479
Saskia: Dus het ligt heel erg aan de markt.
425
00:30:01,799 --> 00:30:08,679
Saskia: Als er uiteindelijk vooral heel veel animo is voor sectorspecifieke modellen, dan gaan we daar volop op inzetten.
426
00:30:09,559 --> 00:30:12,520
Saskia: Maar we denken dat we uiteindelijk op beide paarden moeten wedden.
427
00:30:12,599 --> 00:30:17,960
Saskia: Dus aan de ene kant zou je veel meer op sectorspecifieke toepassingen willen gaan inzoomen.
428
00:30:17,960 --> 00:30:23,240
Saskia: En aan de andere kant willen we ook dat fundament wat we nu hebben gebouwd verder uitbreiden, dus groter maken.
433
00:30:23,399 --> 00:30:27,079
Saskia: Uiteindelijk als je fundament steviger is, kun je er ook meer op voortbouwen.
429
00:30:27,079 --> 00:30:33,319
Saskia: Dus dan gaan die sectorspecifieke toepassingen ook beter zijn, kun je ook meer functionaliteiten verder gaan fine tunen.
430
00:30:34,280 --> 00:30:40,359
Joop: We hebben een kaartspel ontwikkeld samen met het Elisabeth II Steden ziekenhuis uit Tilburg.
431
00:30:40,359 --> 00:30:47,160
Joop: Waar het vooral om gaat, is eigenlijk hoe gaan we als maatschappij met deze technologie om en dan heel gericht in de zorg.
432
00:30:47,319 --> 00:30:49,319
Joop: Daar hebben we allemaal uiteindelijk mee te maken.
433
00:30:49,319 --> 00:30:53,079
Joop: Dus we willen graag aan jou zo stelling ook voorleggen als dat mag.
434
00:31:00,760 --> 00:31:06,839
Unknown: Je denken het zo dit spel bepalen verhalen.
435
00:31:09,960 --> 00:31:12,439
Niels: Dit is de categorie gebruik en toepassingen.
436
00:31:12,440 --> 00:31:14,200
Niels: En de stelling luidt als volgt.
437
00:31:14,200 --> 00:31:18,439
Niels: AI gaat de tijdsbesparing opleveren voor de zorgverlener.
438
00:31:19,399 --> 00:31:21,639
Saskia: Dat is wel de belofte en dat is ook de hoop.
439
00:31:21,640 --> 00:31:23,240
Saskia: En ik denk zeker dat het kan.
440
00:31:23,399 --> 00:31:27,880
Saskia: Ik denk dat daarbij de techniek niet de grootste hobbel is, maar de cultuur.
441
00:31:28,200 --> 00:31:29,639
Saskia: Manier van werken.
442
00:31:30,200 --> 00:31:41,159
Saskia: De zorg is wel een ongelooflijk lastig domein, ik weet er niet veel van, maar ik heb me wel eens laten vertellen dat daar zo'n 9000 verschillende organisaties en freelancers actief zijn.
443
00:31:41,480 --> 00:31:50,359
Saskia: Heel veel fragmentatie, dat maakt het gewoon ontzettend lastig om daar met geïntegreerde oplossingen te komen.
444
00:31:51,079 --> 00:31:57,959
Saskia: Dus ja, ik geloof er zeker weten in dat de zorg heel erg heel veel baat heeft bij AI.
445
00:31:58,520 --> 00:31:59,640
Joop: Even slokje water.
446
00:31:59,640 --> 00:32:00,599
Joop: Ja, zeker.
447
00:32:02,280 --> 00:32:05,079
Saskia: Dankjewel.
448
00:32:10,520 --> 00:32:13,960
Saskia: Ik denk dat de zorg echt heel veel baat kan hebben bij AI.
449
00:32:14,439 --> 00:32:18,119
Saskia: Alleen dan kijken naar de rapportageverplichtingen.
450
00:32:18,599 --> 00:32:25,479
Saskia: Zoiets simpels als het samenvatten van informatie, als je dat op een goede manier kan doen, kun je zelf veel informatie ontsluiten.
451
00:32:25,480 --> 00:32:29,799
Saskia: Maar het is ontzettend belangrijk dat die informatie compleet en correct en juist is.
452
00:32:30,039 --> 00:32:32,839
Saskia: En daar zit natuurlijk wel de twijfel.
453
00:32:38,039 --> 00:32:42,839
Joop: Gebeurt soms gebeurt ons ook geen probleem.
454
00:32:43,319 --> 00:32:45,480
Joop: Ik ben wel benieuwd.
455
00:32:46,599 --> 00:32:52,199
Joop: Je gaf daar straks aan van jullie hebben natuurlijk de privacy heel goed op orde.
456
00:32:52,359 --> 00:32:57,400
Joop: Zou het ook niet een hele mooie combinatie zijn, juist GPT-NL en de zorg.
457
00:32:57,399 --> 00:33:02,919
Joop: Omdat daar natuurlijk heel vaak een drempel ligt van ja, maar waar sturen we het dan naartoe.
458
00:33:03,559 --> 00:33:07,079
Joop: Het lijkt wel een beetje een match made in haven.
459
00:33:10,119 --> 00:33:10,920
Saskia: Absoluut.
460
00:33:10,920 --> 00:33:21,559
Saskia: We denken ook zeker dat de zorg een heel mooi toepassingsdomein kan zijn van dit soort soevereine en betrouwbare Europese modellen tegelijkertijd zijn we ook realistisch.
461
00:33:21,559 --> 00:33:26,839
Saskia: De zorg is ook een heel moeilijk domein om nieuwe innovaties in weg te zetten.
462
00:33:26,839 --> 00:33:35,400
Saskia: Dus het is ook niet het eerste veld waarbinnen we GPT-NL gaan aanbieden of waar we aan het experimenteren zijn.
463
00:33:35,879 --> 00:33:39,960
Saskia: Experimenteren kun je heel goed doen, zou ook binnen de zorg kunnen.
464
00:33:39,960 --> 00:33:43,399
Saskia: Maar we vinden het ook best wel een tricky veld.
465
00:33:44,599 --> 00:33:50,599
Saskia: Het is zo ontzettend belangrijk dat je daar met betrouwbare informatie werkt en als je modellen te vertrouwen zijn.
466
00:33:50,599 --> 00:33:56,919
Saskia: En kwaliteit en performance, die zijn gewoon echt kun je niet omheen.
467
00:33:56,919 --> 00:34:01,400
Saskia: Dus we vinden het wel heel belangrijk dat we goed weten wat GPT-NL wel en niet kan.
468
00:34:01,640 --> 00:34:05,000
Saskia: Zeker in dit soort kritische gebieden.
469
00:34:05,319 --> 00:34:07,559
Saskia: We merken ook dat de zorg wat terughoudend is.
470
00:34:07,559 --> 00:34:13,719
Saskia: Dus we hebben wel wat haalbaarheidsstudies bij de publieke overheid en inderdaad ook kleine aantal commerciële clubs, maar nog niet in de zorg.
471
00:34:13,719 --> 00:34:14,639
Joop: Snap ik.
472
00:34:14,199 --> 00:34:20,879
Joop: Wanneer zouden we hadden over het geld en het exploiteren van het model.
473
00:34:21,520 --> 00:34:28,480
Joop: Wanneer zou het moment zijn dat je het breder beschikbaar zou stellen dat mensen het ook kunnen gaan afnemen?
474
00:34:28,719 --> 00:34:33,039
Saskia: Ja, we zullen het altijd voor zakelijk eindgebruik inzetten.
475
00:34:33,599 --> 00:34:43,679
Saskia: We hebben op dit moment alleen bij de haalbaarheidsstudies beta versies van het model draaien op de infrastructuur van de klanten zelf.
476
00:34:49,520 --> 00:34:56,400
Niels: Ik ga het hele flesje water.
477
00:35:00,560 --> 00:35:12,880
Saskia: Het is de bedoeling dat we aan het einde van dit jaar een gehoste versie van het model gaan aanbieden, dan is het veel makkelijker te gebruiken voor allerlei organisaties, dus ook organisaties die niet het model zelf kunnen hosten.
478
00:35:13,600 --> 00:35:21,520
Niels: En je zegt zakelijk, omdat het niet bedoeld is om bij de burgers te brengen vanwege concurrentievoordeel en dat soort zaken.
479
00:35:21,680 --> 00:35:26,160
Saskia: Dat is niet zozeer de reden, maar we hebben het vooral geschikt gemaakt voor zakelijk gebruik.
480
00:35:27,359 --> 00:35:55,280
Saskia: Je zou het als privépersoon gewoon in je eigen vrije tijd prima kunnen gebruiken, maar dan moet je wel een commerciële licentie afnemen, dat is waarschijnlijk voor heel veel van ons helemaal niet interessant als je het voor je appeltaartrecepten, je bent van harte welkom om dan een licentie af te nemen bij GPT-NL, maar ik denk dat dat niet zo interessant is voor de consumentenmarkt, en het is ook gewoon niet geschikt gemaakt voor allerlei toepassingen waar consumenten veel AI voor gebruiken.
481
00:36:00,080 --> 00:36:10,560
Joop: Wat zijn nou de reacties die je over het algemeen krijgt op het initiatief wat jullie aan het ontplooien zijn.
482
00:36:10,959 --> 00:36:14,400
Joop: Voor Trump, jullie zijn gek, na Trump fijn.
483
00:36:16,720 --> 00:36:24,640
Joop: Een van de weinige mensen die blij zijn dat daar gebeurt, we noemen ze ook wel eens onze beste marketeers.
484
00:36:27,359 --> 00:36:28,160
Saskia: Dat is natuurlijk wel zo.
485
00:36:28,160 --> 00:36:41,519
Saskia: Je merkt dat de publieke opinie enorm omgeslagen is, we merkte eigenlijk al toen Deepseek uitkwam, dat dat ook al wel het een en ander heeft veranderd in de algemene blik op GPT-NL.
486
00:36:42,240 --> 00:36:51,839
Joop: Dat was een Chinees model die in één keer als veel goedkoper, zoals zij dat ontwikkeld hadden in één keer naar boven kwam.
487
00:36:51,839 --> 00:36:57,760
Saskia: Precies, eerst was het beeld ook een beetje met dat geld, jullie zijn gek, waarom zou je het überhaupt proberen?
488
00:36:57,919 --> 00:37:02,479
Saskia: Toen kwam Deepseek dat model leek erop dat het met veel minder geld gebouwd is.
489
00:37:02,479 --> 00:37:04,000
Saskia: Oh ja, het kan dus wel.
490
00:37:04,399 --> 00:37:09,839
Saskia: En toen kwam Trump en toen werd het hele discussie rondom digitale soevereiniteit ineens super belangrijk.
496
00:37:09,839 --> 00:37:14,640
Saskia: En we moeten onze eigen Europese producten maken in eigen beheer hebben.
491
00:37:15,359 --> 00:37:24,639
Saskia: Al die discussies samen hebben ervoor gezorgd dat we nu heel veel fans hebben, dat mensen heel enthousiast reageren op het initiatief, het ook een warm hart toedragen.
492
00:37:24,640 --> 00:37:31,439
Saskia: Maar vanaf het begin af aan merkten we al wel dat we heel veel steun hadden bij allerlei partijen, maar nu merken we dat die steun breder en breder wordt.
493
00:37:34,799 --> 00:37:39,280
Niels: Stel, we zijn drie jaar verder, waar hoop je dan dat we staan.
494
00:37:39,600 --> 00:37:54,959
Saskia: Dan hebben we een model dat niet alleen maar geschikt is voor Nederlandse use cases, maar gewoon in heel Europa ingezet kan worden geschikt dus bij meerdere talen, maar ook veel meer functionaliteiten heeft, dan niet alleen maar beter is in RAG, maar ook met spraak kan omgaan, misschien ook met andere modaliteiten.
495
00:37:54,959 --> 00:37:58,880
Saskia: Ik denk aan de zorg, stel ik misschien goed met sensordata omgaan.
496
00:38:02,479 --> 00:38:08,479
Saskia: Over drie jaar weet ik ook gewoon dat het een model is dat je niet alleen maar gebruikt uit een soort idealisme.
497
00:38:08,640 --> 00:38:11,680
Saskia: Omdat het ook daadwerkelijk goed genoeg is voor de eindgebruiker.
498
00:38:12,479 --> 00:38:15,200
Saskia: Want uiteindelijk is idealisme heel fijn.
499
00:38:15,439 --> 00:38:22,559
Saskia: En het is heel mooi dat je een soeverein model hebt, maar als het gewoon niet goed genoeg werkt, dan is het ook heel erg zonde.
500
00:38:22,559 --> 00:38:36,640
Saskia: Dus we willen er echt voor zorgen dat het model fit for purpose is dat het breed gebruikt kan worden voor de use cases waar echt waarde toevoegt ik kan me zo voorstellen, we begonnen helemaal in het begin dat je taalwetenschapper gestudeerd hebt.
501
00:38:37,040 --> 00:38:41,760
Joop: Dat een traject als dit van de afgelopen jaren ook iets met jezelf heeft gedaan.
502
00:38:43,919 --> 00:38:48,640
Joop: Dat is wel grappig aan de ene kant wel aan de andere kant ben ik gewoon nog steeds Saskia.
503
00:38:49,999 --> 00:38:55,359
Saskia: Ja, het is heel grappig, want we hebben zo'n geluk met het tijdstip waarop we dit zijn begonnen.
504
00:38:55,359 --> 00:38:57,520
Saskia: We hebben nu zoveel positieve energie mee.
505
00:38:57,760 --> 00:39:04,280
Saskia: Ik had een paar jaar geleden nooit gedacht dat ik een podcast zou opnemen dat ik zoveel op een podium zou mogen staan.
506
00:39:04,519 --> 00:39:06,119
Saskia: Dus je leert heel veel.
507
00:39:06,120 --> 00:39:08,680
Saskia: Ik vind het ook heel fijn dat we met zo'n groot team eraan werken.
508
00:39:08,680 --> 00:39:11,640
Saskia: Dus je ontwikkelt je inderdaad als mensen ook enorm.
509
00:39:12,439 --> 00:39:17,879
Saskia: Kijk ook al wel een beetje op een andere manier naar technologie en de verantwoordelijkheid die je daar ook wel in kan pakken.
510
00:39:17,879 --> 00:39:19,480
Niels: Wat is daar veranderd?
511
00:39:20,359 --> 00:39:29,080
Saskia: In plaats van een beetje passief zitten met ja, zo is het nou eenmaal en een beetje klagen steeds meer geleerd dat je ja inderdaad kom op.
512
00:39:29,640 --> 00:39:34,519
Saskia: Dat kan niet meer al complex, wat we hebben met z'n allen dat moeten we een beetje loslaten.
513
00:39:34,519 --> 00:39:40,039
Saskia: En het is heel makkelijk om een beetje te klagen over hoe dingen niet ideaal zijn, maar daar kom je niet zoveel mee verder.
514
00:39:40,040 --> 00:39:43,240
Saskia: En ik vind dat dat wel heel mooie lessens die we nu hebben geleerd.
515
00:39:43,720 --> 00:39:45,959
Saskia: Oké, je mag best wel een keer diep zuchten.
516
00:39:45,959 --> 00:39:49,640
Saskia: Maar ga dan kijken wat je wel kan doen en kijk wat er binnen je mogelijkheden ligt.
517
00:39:49,640 --> 00:39:51,880
Saskia: En dat is vaak toch een stuk meer dan je denkt.
518
00:39:52,200 --> 00:39:56,040
Joop: Mooi sluiting.
519
00:39:56,040 --> 00:39:59,960
Niels: Ik was ook afsluiten.
520
00:40:00,280 --> 00:40:02,200
Niels: Ik was een groot team.
521
00:40:02,439 --> 00:40:03,479
Niels: Hoe groot moet ik denken?
522
00:40:03,479 --> 00:40:06,280
Niels: Want ja, het is nogal wat een eigen LLM gaan bouwen.
523
00:40:06,280 --> 00:40:09,000
Niels: Wat voor discipline zijn hoe groot was het team?
524
00:40:09,319 --> 00:40:14,280
Saskia: In het begin hadden we pak een beetje zo'n twintig mensen die erbij betrokken zijn.
525
00:40:14,280 --> 00:40:22,280
Saskia: En dan zijn dat niet alleen maar de engineers en de data scientist, maar dat zijn ook mensen die specialist heel veel weten van marketing en communicatie.
526
00:40:22,280 --> 00:40:25,000
Saskia: We hebben natuurlijk heel veel juristen aan boord.
527
00:40:24,999 --> 00:40:28,200
Saskia: Ethici taalwetenschappers zoals ik.
528
00:40:28,680 --> 00:40:32,679
Saskia: En dan gaandeweg zijn er ook wat meer mensen bijgekomen.
529
00:40:32,680 --> 00:40:37,399
Saskia: Er zijn nu vooral ook bij die haalbaarheidsstudies werken we ook met businessconsultants.
530
00:40:37,399 --> 00:40:44,040
Saskia: Die ook heel goed in staat zijn om de vraag van de klant te verbinden aan waar de engineers mee bezig zijn.
531
00:40:44,200 --> 00:40:46,359
Saskia: De rollen kristalliseren zich een beetje uit.
532
00:40:46,359 --> 00:40:49,240
Saskia: En tegelijkertijd heeft iedereen zes petten op.
533
00:40:49,720 --> 00:40:51,799
Saskia: Dat is ook een beetje het is nieuwe technologie.
534
00:40:51,799 --> 00:40:53,720
Saskia: We proberen van alles en nog wat.
535
00:40:53,720 --> 00:40:55,399
Saskia: Ontwikkelingen gaan ontzettend snel.
536
00:40:55,399 --> 00:40:57,479
Saskia: Dus we moeten meerdere dingen een beetje kunnen.
537
00:40:57,479 --> 00:41:00,280
Saskia: En we hebben het geluk dat we heel veel experts om ons heen hebben.
538
00:41:00,280 --> 00:41:03,799
Niels: Ja, en heel veel kennis die we dus ook opdoen binnen Europa binnen Nederland.
539
00:41:03,799 --> 00:41:07,400
Niels: Over hoe zouden we dit volgende keer weer anders doen, nog beter kunnen doen.
540
00:41:08,999 --> 00:41:15,720
Niels: Hoe kunnen mensen die kennis ook tot zich nemen, die niet wel onderdeel van het traject waren, maar wel meer over zou willen weten.
541
00:41:16,200 --> 00:41:24,519
Saskia: We hebben nu op onze website hebben we wat toegankelijke blogs staan en interviews over het initiatief, dus GPT-NL.
542
00:41:28,439 --> 00:41:35,080
Saskia: Voor mensen die weinig werken met AI is het heel toegankelijk en hopelijk ook leuk om een beetje te lezen.
543
00:41:35,399 --> 00:41:41,240
Saskia: We hebben ook een Hugging Face pagina waarop we onze datasets hebben gepubliceerd.
544
00:41:41,240 --> 00:41:44,760
Saskia: Dus alle publieke data die we hebben verzameld, die is daar te downloaden.
545
00:41:44,760 --> 00:41:47,720
Saskia: En alle private datasets, die zijn daar uitgebreid beschreven.
546
00:41:47,720 --> 00:41:50,280
Saskia: Dus je kan daar precies vinden wat we hebben gebruikt.
547
00:41:50,280 --> 00:41:55,240
Saskia: En dan zijn mensen vrij om zelf bij die partijen aan te kloppen als ze die data ook willen.
548
00:41:56,120 --> 00:41:59,479
Saskia: En daar hebben we ook artikelen over gepubliceerd hoe we dat hebben gedaan.
549
00:41:59,479 --> 00:42:01,159
Saskia: Dus dat kun je dan ook bekijken.
550
00:42:01,160 --> 00:42:04,200
Saskia: En we hebben een GitHub pagina waarin al onze code te vinden is.
551
00:42:04,200 --> 00:42:06,039
Saskia: We hebben ook uitgebreid gedocumenteerd.
552
00:42:06,040 --> 00:42:07,799
Saskia: Dus daar kun je ook die code zelf bekijken.
553
00:42:07,799 --> 00:42:09,560
Saskia: Je kan de documentatie lezen.
554
00:42:09,879 --> 00:42:14,839
Joop: Wat was daar de overweging van om die dan zo open beschikbaar te stellen?
555
00:42:15,479 --> 00:42:19,320
Saskia: Dat we wel belangrijk vinden dat we ook iets bijdragen aan de community.
556
00:42:19,479 --> 00:42:24,599
Saskia: Vanwege de afspraken met de dataleveranciers, kun je niet zomaar alles opengooien.
557
00:42:24,600 --> 00:42:36,519
Saskia: We vinden het heel belangrijk dat er wel een data-ecosysteem ontstaat, waarbij de makers ook een stukje mee kunnen profiteren van hopelijk alle inkomsten die we gaan maken met elkaar.
558
00:42:36,519 --> 00:42:40,039
Saskia: Er moet gewoon een gezonde ecosysteem zijn waar iedereen baat bij heeft.
559
00:42:40,040 --> 00:42:41,719
Saskia: En die code.
560
00:42:41,720 --> 00:42:48,440
Saskia: Ja, met zulke beperkte budgetten, ga je niet ga je niet allemaal nieuwe gekke dingen doen, dan ga je gewoon pakken wat werkt.
561
00:42:48,439 --> 00:42:53,879
Saskia: Dus wat dat betreft hebben we niet een heel extreem nieuwe manier van model trainen gebruikt.
562
00:42:53,879 --> 00:43:00,680
Saskia: We hebben daar gewoon gepakt wat heel veel andere mensen ook gebruiken, waarvan we weten wat werkt, met hier en daar wat kleine specifieke aanpassingen.
563
00:43:00,680 --> 00:43:04,120
Saskia: Dus dat is voor iedereen om te bekijken en zelf te herhalen.
564
00:43:04,439 --> 00:43:10,599
Saskia: Als je dit model op dezelfde manier zou willen trainen, dan heb je miljoenen euro's nodig om alleen al de rekenkracht te kunnen betalen.
565
00:43:10,839 --> 00:43:14,359
Saskia: Dus dat zal niet zo snel gekopieerd kunnen worden.
566
00:43:14,680 --> 00:43:18,919
Saskia: En zeker de data is uiteindelijk een van de allerbelangrijkste ingrediënten.
567
00:43:19,399 --> 00:43:22,120
Saskia: Die kun je niet zomaar wegtrekken.
568
00:43:24,359 --> 00:43:28,359
Niels: Ik was zo nieuwsgierig, je was hier onderweg vanuit Den Haag, inderdaad.
569
00:43:29,319 --> 00:43:32,680
Niels: Wat was een vraag die je wel had verwacht die we niet gesteld hebben?
570
00:43:38,280 --> 00:43:46,080
Saskia: Ja, ik krijg zoveel vragen dat ik over het algemeen wel een klein beetje voorbereid ben over wat er allemaal langs kan komen.
571
00:43:44,200 --> 00:43:49,200
Saskia: Ik denk deze vraag.
572
00:43:51,040 --> 00:43:53,120
Niels: Dan is die makkelijk.
573
00:43:55,919 --> 00:44:01,760
Joop: Super bedankt dat je ons wilde laten weten, wat er allemaal speelt rondom GPT-NL.
574
00:44:01,760 --> 00:44:13,200
Joop: Ik verwacht dat er ook nog een hoop gaat gebeuren, dus dat de storm nog een tijdje voor je blijven bestaan, de storm mag niet gaan liggen, wat dat betreft.
575
00:44:18,879 --> 00:44:28,559
Joop: Zou er iets zijn, zeg maar wat luisteraars kunnen doen om nog iets aan bij te dragen, wat Niels en ik zouden kunnen doen om bij te dragen, doneer je data.
576
00:44:30,399 --> 00:44:33,360
Joop: Er zijn daar criteria aan verbonden.
577
00:44:35,280 --> 00:44:38,080
Saskia: We hebben wel een lijst van criteria.
578
00:44:39,919 --> 00:44:46,159
Saskia: Maar eigenlijk zeker nu we verder willen opschalen, wordt het steeds belangrijker dat we vooral heel veel data hebben.
579
00:44:46,160 --> 00:44:53,680
Saskia: En dat is niet alleen Nederlandstalige data, dat is ook data in allerlei soorten talen, dus als je datasets hebt als je data wil bijdragen.
580
00:44:53,680 --> 00:44:57,999
Saskia: Als je het mee wil in licentieovereenkomsten, laat het vooral weten.
581
00:44:57,999 --> 00:45:02,159
Saskia: Kom vooral bij ons op de lijn en dan kijken we verder hoe we dat samen inrichten.
582
00:45:02,160 --> 00:45:03,839
Joop: En waar vinden we die lijn?
583
00:45:04,959 --> 00:45:09,280
Saskia: Je kan het beste een mailtje sturen naar info@gpt-nl.nl
584
00:45:11,680 --> 00:45:13,839
Joop: Kijk, we zullen het opnemen in de shownotes.
585
00:45:14,479 --> 00:45:17,680
Saskia: En dan mogen er zeker contact worden opgenomen.
586
00:45:17,680 --> 00:45:23,920
Saskia: We gaan dat ook verder inrichten, verder opschalen, maar dat is eigenlijk nu het allerbelangrijkste dat we meer data verzamelen.
587
00:45:23,919 --> 00:45:25,359
Saskia: Dat kan ook als privépersoon.
588
00:45:25,439 --> 00:45:28,480
Saskia: Als je zegt, ik heb het leuke is.
589
00:45:29,040 --> 00:45:34,000
Saskia: Een van de eerste mensen die bij ons op de lijn kwamen, Aaron Mirck.
590
00:45:36,399 --> 00:45:39,280
Saskia: En hij was echt een van de eerste die op de lijn kwam, maar wat gaaf.
591
00:45:39,280 --> 00:45:41,280
Saskia: En bij deze doneer ik mijn data.
592
00:45:41,280 --> 00:45:42,160
Saskia: Hier zijn mijn boeken.
593
00:45:42,160 --> 00:45:45,200
Saskia: Die mogen jullie gebruiken voor het trainen van GPT-NL.
594
00:45:45,680 --> 00:45:49,599
Saskia: En ook op die kleine schaal zijn data van harte welkom.
595
00:45:49,600 --> 00:45:50,879
Saskia: Dat vinden we ontzettend tof.
596
00:45:50,879 --> 00:45:54,479
Saskia: Ik denk dat we er als we met z'n allen de schouders onder zetten dat we heel ver komen.
597
00:45:54,799 --> 00:45:56,960
Joop: Dan gaan wij ook data doneren.
598
00:45:57,200 --> 00:45:58,560
Joop: Kan ik jou vast beloven?
599
00:45:59,999 --> 00:46:02,479
Joop: Dus oproep aan de luisteraar: doneer je data.
600
00:46:02,720 --> 00:46:09,040
Niels: Ik had nooit gedacht dat ik dat zo uitspreken, dankjewel, Saskia, jullie bedankt.
601
00:46:09,680 --> 00:46:12,479
Joop: Leuk dat je weer luisterde aan deze aflevering.
602
00:46:12,479 --> 00:46:15,200
Joop: Wil je nou iets meer nog weten van Saskia?
603
00:46:15,280 --> 00:46:17,359
Joop: We gaan er namelijk nog een vraag van de maand stellen.
604
00:46:17,359 --> 00:46:21,280
Joop: Dit doen we gelijk aan alle gasten van deze maand.
605
00:46:21,280 --> 00:46:23,839
Joop: En dan hoor je wat ze geantwoord heeft.
606
00:46:23,839 --> 00:46:25,679
Joop: En de vraag is dit keer namelijk.
607
00:46:25,680 --> 00:46:31,040
Joop: Ga ik je dat alvast geven, is: stel, je bent de minister van Digitale Zaken.
608
00:46:31,040 --> 00:46:32,879
Joop: Wat zou je morgen veranderen?
609
00:46:32,879 --> 00:46:38,160
Joop: Dus als je dan de antwoord van Saskia wil weten, abonneer je even via de nieuwsbrief.