AIToday Live

S05E28 - De grenzen van AI: Mythes en realiteiten over zelflerend vermogen

Info Support AIToday Season 5 Episode 28

Use Left/Right to seek, Home/End to jump to start or end. Hold shift to jump forward or backward.

0:00 | 5:25

De laatste weken krijgt Joop de vraag of AI uit zichzelf kan leren van de uitkomsten uit het eigen model. Wordt ChatGPT slimmer en slimmer door wat deze schrijft en dat weer inleest?

Joop legt in 5 minuten uit hoe dat zit en hoe AI-systemen leren.

Stuur ons een bericht

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Schrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!

1
00:00:00,000 --> 00:00:22,120
Ik heb namelijk de afgelopen week, weken, heel veel vragen gekregen van hoe leren machines

2
00:00:22,120 --> 00:00:29,480
nou en er leeft namelijk het idee dat AI zichzelf kan leren en zichzelf verder kan ontwikkelen.

3
00:00:29,480 --> 00:00:37,380
waardoor er ideeën, fantasieën gaan ontstaan dat bijvoorbeeld de krachtige taalmodellen

4
00:00:37,380 --> 00:00:42,720
die we nu hebben, ChatGPT, dat de antwoorden die daaruit komen, dat je die weer terug zou

5
00:00:42,720 --> 00:00:49,000
kunnen voeren aan de machine en dat die zo zichzelf zou kunnen verbeteren waardoor er

6
00:00:49,000 --> 00:00:52,840
een soort van nog meer super intelligentie zou kunnen ontstaan.

7
00:00:52,840 --> 00:00:56,000
Is dat waar?

8
00:00:56,000 --> 00:00:57,000
Nee.

9
00:00:57,000 --> 00:00:59,280
Dat is eigenlijk het korte antwoord.

10
00:00:59,280 --> 00:01:01,760
Kunnen machines bijgeleerd worden?

11
00:01:01,760 --> 00:01:04,160
Ja, maar niet op deze manier.

12
00:01:04,160 --> 00:01:06,600
Ik wil dat wel even in het heel kort uitleggen.

13
00:01:06,600 --> 00:01:13,840
Als we kijken naar hoe we uiteindelijk machine learning modellen trainen, is dat we ze data

14
00:01:13,840 --> 00:01:19,560
geven en vanuit die data proberen ze patronen eruit te halen en vanuit daaruit worden de

15
00:01:19,560 --> 00:01:20,640
antwoorden gemaakt.

16
00:01:20,640 --> 00:01:27,640
En kijk naar bijvoorbeeld een model dat objecten kan herkennen uit foto's.

17
00:01:27,640 --> 00:01:31,000
Wat daar gebeurt is dat daar soms fouten in worden gemaakt.

18
00:01:31,000 --> 00:01:37,800
In plaats van dat je een hond ziet, en er staat een hond op de foto, maar de machine

19
00:01:37,800 --> 00:01:40,160
zegt "Ik denk dat er een kat op staat."

20
00:01:40,160 --> 00:01:48,040
Wat wij dan kunnen doen is dat terugvoeren met ons antwoord erbij en zeggen "Nee, dat

21
00:01:48,040 --> 00:01:49,040
is fout.

22
00:01:49,040 --> 00:01:51,640
Er staat dit op de foto.

23
00:01:51,640 --> 00:01:57,640
En op die manier kan een model opnieuw getraind worden met meer juiste antwoorden.

24
00:01:57,640 --> 00:02:04,560
En dat is een heel groot verschil met als we het nou hebben over, als je nou antwoorden,

25
00:02:04,560 --> 00:02:09,000
dus Chet Jipiti die heeft bijvoorbeeld een artikel voor jou geschreven en je zou dat

26
00:02:09,000 --> 00:02:12,520
artikel zou je uiteindelijk weer terugleveren aan dat model.

27
00:02:12,520 --> 00:02:21,660
Dan ben je hem data terug aan het geven die al voldoende was om deze gegevens uit het

28
00:02:21,660 --> 00:02:22,660
model te krijgen.

29
00:02:22,660 --> 00:02:30,440
De trainingsdata bevatten al het antwoord op de vraag die je gegeven hebt en door deze

30
00:02:30,440 --> 00:02:39,040
weer terug te zetten ben je steeds meer gewicht aan het toekennen op de antwoorden die je

31
00:02:39,040 --> 00:02:40,040
teruglevert.

32
00:02:40,040 --> 00:02:45,040
En daar hebben ze een term voor en dat heet model collapse.

33
00:02:45,040 --> 00:02:49,360
Dus wat er gebeurt is dat je model instort, dus hoe meer je eigenlijk dit soort dingen

34
00:02:49,360 --> 00:02:56,920
teruglevert, hoe meer het model instort en steeds meer dezelfde antwoorden gaat geven.

35
00:02:56,920 --> 00:03:00,040
En dat was nou juist niet de bedoeling toch?

36
00:03:00,040 --> 00:03:07,520
Je moet je niet vergissen hoeveel menselijk handelen, menselijke toevoegingen er aan de

37
00:03:07,520 --> 00:03:09,080
huidige taalmodellen zitten.

38
00:03:09,080 --> 00:03:16,080
Dus om zo'n taalmodel te ontwikkelen hebben we natuurlijk menselijk geschreven teksten,

39
00:03:16,080 --> 00:03:24,080
maar wat die machine geleerd heeft is woord voor woord voorspellen wat het volgende woord zou moeten zijn.

40
00:03:24,080 --> 00:03:28,080
En de machine heeft daar geen enkele betekenis bij.

41
00:03:28,080 --> 00:03:31,080
Wij kennen daar betekenis aan toe aan een zin.

42
00:03:31,080 --> 00:03:36,080
Dus als we een zin lezen dan heeft dat betekenis voor ons, niet voor die machine.

43
00:03:36,080 --> 00:03:38,840
Dus wat hebben ze bijvoorbeeld bij OpenAI gedaan?

44
00:03:38,840 --> 00:03:45,440
Is dat ze allerlei antwoorden op één en dezelfde vraag voor hebben gelegd aan mensen.

45
00:03:45,440 --> 00:03:51,720
En ze zeggen van, ja maar welke antwoord heeft nou de meeste betekenis bij deze vraag?

46
00:03:51,720 --> 00:03:53,320
En dat wordt bijgetraind.

47
00:03:53,320 --> 00:04:02,720
Dus er zit ontzettend veel handwerk, mensenwerk komt eraan te pas om ervoor te zorgen dat wat er uit zo'n model komt,

48
00:04:02,720 --> 00:04:05,840
dat dat ergens voor ons op slaat.

49
00:04:05,840 --> 00:04:12,040
Daarnaast zitten er ook heel veel vangrils, zou je kunnen zeggen, eromheen.

50
00:04:12,040 --> 00:04:17,640
Dat wij als mens ook hebben aangegeven, bij deze vragen wil ik niet dat je antwoord geeft.

51
00:04:17,640 --> 00:04:21,880
Of wil ik juist dat je heel specifiek altijd dit antwoord geeft.

52
00:04:21,880 --> 00:04:22,880
Hoe maak ik een bom?

53
00:04:22,880 --> 00:04:24,440
Daar heb ik geen antwoord op.

54
00:04:24,440 --> 00:04:26,840
Dat soort dingen.

55
00:04:26,840 --> 00:04:37,840
Dus ja, we kunnen machines bijleren door meer data te geven, andere data te geven, of dat

56
00:04:37,840 --> 00:04:42,080
we zeggen "hé, we voeren correcties toe, want het antwoord wat je hier gegeven hebt

57
00:04:42,080 --> 00:04:47,440
is niet juist, je moet dit antwoord geven, is eigenlijk ook weer nieuwe data, maar dat

58
00:04:47,440 --> 00:04:56,460
de machine als een soort van zelfbedenkend ding vanuit jouw laptop in één keer een intelligentie

59
00:04:56,460 --> 00:05:01,900
wordt omdat hij van alles zou kunnen leren. Nee. Wij bepalen wat het doel is. Wij bepalen

60
00:05:01,900 --> 00:05:08,060
waar het model op geoptimaliseerd is. En bij taalmodellen is het geoptimaliseerd in eerste

61
00:05:08,060 --> 00:05:11,900
instantie correcte zinnen schrijven, grammaticaal, syntactisch.

62
00:05:11,900 --> 00:05:16,300
En je kan die data niet terugdoen.

63
00:05:16,300 --> 00:05:20,300
Ik hoop dat je weer wat wijzer bent. Tot de volgende keer.

64
00:05:20,300 --> 00:05:25,300
[Muziek]