1
00:00:00,000 --> 00:00:10,000
Vandaag bij AIToday Live. Wat is machine learning en deep learning en hoe vormen deze de basis
2
00:00:10,000 --> 00:00:17,000
voor generatieve AI? En er is een game changer op komst, maar daar hoor je later meer over in
3
00:00:17,000 --> 00:00:23,160
deze aflevering. Laten we beginnen bij machine learning de basis. Machine learning is de kern
4
00:00:23,160 --> 00:00:29,040
van veel AI systemen. Het is een methode waarbij computers leren van data om taken te verrichten
5
00:00:29,040 --> 00:00:35,360
zonder expliciet geprogrammeerd te zijn voor specifieke situaties. Dit leren gebeurt door
6
00:00:35,360 --> 00:00:42,240
algoritme die patronen en regelmatigheden in de data herkennen. Denk bijvoorbeeld aan spam filters
7
00:00:42,240 --> 00:00:48,600
in e-mail. Een machine learning model wordt getraind met voorbeelden van zowel spam als
8
00:00:48,600 --> 00:00:54,120
niet spam e-mails en het leert onderscheid te maken op basis van kenmerken zoals bijvoorbeeld
9
00:00:54,120 --> 00:00:59,760
sleutelwoorden afzenden opmaak. Zodra het model getraind is kan het nieuwe e-mails beoordelen
10
00:00:59,760 --> 00:01:09,120
en spam effectief filteren. Eentje verder hebben we deep learning. Deep learning is een subset van
11
00:01:09,120 --> 00:01:15,360
machine learning maar met een diepere en complexe benadering. Het maakt gebruik van normale netwerken
12
00:01:15,360 --> 00:01:21,640
met vele lagen en daarmee ook diep om nog complexere patronen in grote datasets te herkennen.
13
00:01:21,640 --> 00:01:26,680
Een bekend voorbeeld van deep learning is beeldherkenning. Systemen kunnen afbeeldingen
14
00:01:26,680 --> 00:01:32,720
analyseren en objecten identificeren van gezicht tot landschappen. Deze technologie
15
00:01:32,720 --> 00:01:38,600
wordt gebruikt in zelfrijdende auto's bijvoorbeeld waar het essentieel is dat het voetgangers en
16
00:01:38,600 --> 00:01:46,240
andere voertuigen en verkeersborden herkent. Een andere techniek in de ER is reinforcement
17
00:01:46,240 --> 00:01:50,840
learning. In tegenstelling tot de eerdere benaderingen waarbij je een model leert van
18
00:01:50,840 --> 00:01:56,520
een bestaande dataset leert reinforcement door interactie met zijn omgeving. Het is
19
00:01:56,520 --> 00:02:01,960
gebaseerd op het principe van trial and error waarbij het model beloningen ontvangt voor
20
00:02:01,960 --> 00:02:07,640
juiste beslissingen en soms straffen voor fouten. Dit is bijvoorbeeld gebruikt om
21
00:02:07,640 --> 00:02:14,400
ChatGPT te trainen. Dus voor goede antwoorden bij een vraag wordt een beloning gegeven,
22
00:02:14,400 --> 00:02:24,560
bij een slecht antwoord wordt een straf uitgedeeld. En dan komen we op de generatieve AI. Want
23
00:02:24,560 --> 00:02:31,000
die verbindt eigenlijk al deze technieken. Het is generatieve AI gaat nog een stap verder.
24
00:02:31,000 --> 00:02:36,720
In plaats van alleen data te analyseren en te classificeren met machine learning genereert
25
00:02:36,720 --> 00:02:43,640
deze vorm van AI nieuwe content. Denk aan kunstwerken, muziek of tekst die niet van
26
00:02:43,640 --> 00:02:51,520
menselijk werk te onderscheiden is. Het bekendste voorbeeld is GPT-4 van OpenAI. Een large
27
00:02:51,520 --> 00:02:57,760
language model, een taalmodel dat in staat is om overtuigende teksten te genereren. Daarmee
28
00:02:57,760 --> 00:03:04,480
hebben we eigenlijk een heel breed spectrum van AI technieken te pakken. Van het analyseren
29
00:03:04,480 --> 00:03:09,800
van data, machine learning, naar het herkennen van complexe patronen, deep learning, tot
30
00:03:09,800 --> 00:03:16,440
het leren van interactieve acties in een omgeving met reinforcement learning. En die spelen
31
00:03:16,440 --> 00:03:21,440
allemaal een cruciale rol in de ontwikkeling van generatieve AI.
32
00:03:21,440 --> 00:03:28,820
Maar, de game changer, er is een volgende stap die vooral large language models beter
33
00:03:28,820 --> 00:03:35,280
gaat maken. En het grootste probleem nu is dat je geen bronvermelding krijgt bij GPT
34
00:03:35,280 --> 00:03:41,280
of welk ander large language model dan ook. Maar daar gaat verandering in komen met een
35
00:03:41,280 --> 00:03:48,120
nieuwe techniek en die heet Retrieval Augmented Generation. In gewoon Nederlands zou je zeggen
36
00:03:48,120 --> 00:03:53,960
het genereren van tekst aangevuld met kennis uit de bron. Deze techniek is ontwikkeld
37
00:03:53,960 --> 00:03:59,040
voor het verbeteren van de kwaliteit van gegenererde antwoorden. De techniek werkt door feiten
38
00:03:59,040 --> 00:04:06,640
uit een externe database te halen. Deze feiten helpen om juist die grote taalmodellen, zodat
39
00:04:06,640 --> 00:04:12,560
ze gebruik kunnen maken van de nieuwste en meest correcte informatie. Dit maakt het mogelijk
40
00:04:12,560 --> 00:04:17,840
voor gebruikers om beter te begrijpen hoe deze taalmodellen hun antwoorden genereren.
41
00:04:17,840 --> 00:04:26,760
Hierdoor vermindert de kans dat het taalmodel gevoelige data lekt of misleidende informatie,
42
00:04:26,760 --> 00:04:30,600
tussen aanhalingstekens, hallucineert, oftewel fouten maakt.
43
00:04:30,600 --> 00:04:36,760
Het is die Retrieval Augmented Generation vormt dus een belangrijke toevoeging aan de basis
44
00:04:36,760 --> 00:04:42,200
van generatieve AI door een extra laag van betrouwbaarheid en relevantie toe te voegen
45
00:04:42,200 --> 00:04:47,880
aan de informatie die wordt gegenereerd. Deze technologie staat aan de vooravond van de
46
00:04:47,880 --> 00:04:54,260
nieuwe fase in de evolutie van generatieve AI, waarbij, denk ik, de betrouwbaarheid en
47
00:04:54,260 --> 00:04:58,440
nauwkeurigheid van gegenereerde inhoud aanzienlijk wordt verbeterd.
48
00:04:58,440 --> 00:05:05,440
Bedankt voor het luisteren, vergeet je niet te abonneren via je favoriete podcast app,
49
00:05:05,440 --> 00:05:06,880
en tot de volgende keer!
50
00:05:07,020 --> 00:05:07,520
Tot ziens!
51
00:05:07,520 --> 00:05:19,640
[Muziek]
52
00:05:19,640 --> 00:05:22,040