AIToday Live

S05E36 - Shorts - ChatGPT liegt niet! Waarheid over Large Language Models

Info Support AIToday Season 5 Episode 36

Use Left/Right to seek, Home/End to jump to start or end. Hold shift to jump forward or backward.

0:00 | 6:50

In deze aflevering van onze podcast gaan we in op het fenomeen van large language modellen, zoals ChatGPT en Google Bard. Deze modellen kunnen niet liegen, omdat ze simpelweg geen intentie hebben. Liegen vereist opzettelijkheid en deze modellen zijn geprogrammeerd om correcte zinnen te produceren, zonder intentie.

We spreken ook over de valkuil van het vermenselijken van machines en het toekennen van eigenschappen die ze niet bezitten.

Stuur ons een bericht

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Schrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!

1
00:00:00,000 --> 00:00:08,440
ChatGPT, Google Bard, Microsoft Bing of welke large language model dan ook, die liegen niet.

2
00:00:08,440 --> 00:00:12,600
Er wordt gezegd ze kunnen glashard liegen, maar dat is niet waar.

3
00:00:12,600 --> 00:00:13,600
Waarom?

4
00:00:13,600 --> 00:00:14,600
Dat hoor je zo.

5
00:00:14,600 --> 00:00:21,720
Welkom bij een nieuwe aflevering van AIToday Live Shorts, een actueel onderwerp over AI in

6
00:00:21,720 --> 00:00:22,720
5 minuten.

7
00:00:22,720 --> 00:00:27,840
Nou zul je denken, nou die is een beetje gek geworden.

8
00:00:27,840 --> 00:00:36,000
er wordt overal gezegd dat chat GPT glashard kan liegen. Maar ik ga het je uitleggen. Liegen is

9
00:00:36,000 --> 00:00:44,200
opzettelijk. Liegen is een intentie. En wat is er nou met met large language models zoals chat GPT,

10
00:00:44,200 --> 00:00:49,840
Google Bart, alles wat ik heb genoemd net in de inleiding. Dat zijn machines en machines

11
00:00:49,840 --> 00:00:56,000
hebben geen intentie. Trouwens niet alleen mensen liegen, maar honden kunnen dat ook. Ik heb daar

12
00:00:56,000 --> 00:01:00,620
een leuk verhaal over, maar blijf daar even dan voor naar het eind van de aflevering hangen als je

13
00:01:00,620 --> 00:01:06,140
die zou willen weten. Nou wat ik al zegde, large language models hebben geen intentie.

14
00:01:06,140 --> 00:01:12,260
Die zijn geprogrammeerd en deze large language modellen zijn geprogrammeerd om correcte zinnen

15
00:01:12,260 --> 00:01:18,460
te maken. Wat ze doen is token voor token voorspellen. Iedere keer het volgende stukje

16
00:01:18,460 --> 00:01:24,860
van een woord of een heel woord, dat noemen we dan een token, voorspellen. Wat uiteindelijk

17
00:01:24,860 --> 00:01:31,140
zeg maar moet leiden tot een correcte, syntactische en grammaticaal correcte zin.

18
00:01:31,140 --> 00:01:37,300
De betekenis, die verbinden wij eraan.

19
00:01:37,300 --> 00:01:45,220
Het hele model is gemaakt om uiteindelijk goede zinnen te creëren, goede Nederlandse,

20
00:01:45,220 --> 00:01:47,660
Engelse, welke taal dan ook, zinnen te creëren.

21
00:01:47,660 --> 00:01:55,640
En vanuit de mensen, OpenEAR heeft allerlei mensen voor ingehuurd, die zeggen van "dit

22
00:01:55,640 --> 00:02:06,920
antwoord klopt bij die vraag" en zo is die getraind om zo goed mogelijk betekenisvolle

23
00:02:06,920 --> 00:02:07,920
antwoorden te geven.

24
00:02:07,920 --> 00:02:17,080
Dus wij geven betekenis aan die zinnen en als we zeggen dat large language models liegen,

25
00:02:17,080 --> 00:02:22,400
maken we wat mij betreft een fundamentele fout. Want dan maken we er iets menselijks

26
00:02:22,400 --> 00:02:29,760
van en dat is deze machine niet. We moeten het juist niet vermenselijken en dat is zo

27
00:02:29,760 --> 00:02:34,680
lastig want dat doen we met alles. Dat doen we met dieren, met objecten. Maar door het

28
00:02:34,680 --> 00:02:43,440
dus liegen te noemen zou er een… nou ja, dan ga je ervan uit dat dat opzettelijk gebeurt.

29
00:02:43,440 --> 00:02:48,200
Uiteraard maken dit soort modellen fouten.

30
00:02:48,200 --> 00:02:52,600
Het kunnen hele vervelende fouten zijn, het kunnen hele subtiele fouten zijn.

31
00:02:52,600 --> 00:02:56,000
En hoe subtieler de fout, hoe lastiger het is om ons te ontdekken.

32
00:02:56,000 --> 00:03:02,640
Maar als wij niet snappen dat dit soort modellen fouten kunnen maken, dan behandelen we ze

33
00:03:02,640 --> 00:03:05,920
ook niet als zodanig de uitkomst wat je daarmee moet.

34
00:03:05,920 --> 00:03:11,280
Het is heel belangrijk dat we snappen dat het fouten zijn.

35
00:03:11,280 --> 00:03:16,840
Als we weten wat het fouten kan opleveren, dan kunnen we het hebben over welke controle

36
00:03:16,840 --> 00:03:18,800
zou je er aan willen toevoegen.

37
00:03:18,800 --> 00:03:23,920
Misschien zelf of als je dit in een productieomgeving binnen je organisatie zou willen gebruiken.

38
00:03:23,920 --> 00:03:26,720
Welke vangrils zet je dan in?

39
00:03:26,720 --> 00:03:32,320
Een van de dingen waarvan wordt gezegd dat hij liegt is bijvoorbeeld over het geven van

40
00:03:32,320 --> 00:03:33,320
weblinks.

41
00:03:33,320 --> 00:03:39,920
Dus hij kan een weblink geven en als je daarop klikt werkt hij niet.

42
00:03:39,920 --> 00:03:43,440
Uiteindelijk heeft hij allemaal van die stukjes aan elkaar geknopt.

43
00:03:43,440 --> 00:03:47,320
Lijkt het een goede weblink, is het een fout.

44
00:03:47,320 --> 00:03:54,400
Dus we moeten opletten dat we de machine niet vermenselijken en daarom dus ook geen eigenschappen

45
00:03:54,400 --> 00:03:56,120
toekennen die het niet heeft.

46
00:03:56,120 --> 00:03:57,120
Liegen.

47
00:03:57,120 --> 00:04:01,960
Wat we wel moeten zien is dat het een heel handig gereedschap is en het zo gebruiken.

48
00:04:01,960 --> 00:04:06,240
En dit gereedschap kan fouten maken, ernstige fouten.

49
00:04:06,240 --> 00:04:09,440
En het is aan ons om daar goed mee om te gaan.

50
00:04:09,440 --> 00:04:14,940
Als je met je hamer op je hand slaat, dan is het ook niet dat die hamer in een keer

51
00:04:14,940 --> 00:04:17,040
de intentie had om je te mishandelen.

52
00:04:17,040 --> 00:04:20,400
Nee, het is uiteindelijk hoe je het gereedschap hebt gebruikt.

53
00:04:20,400 --> 00:04:29,800
Dus wat mij betreft, opletten, niet-vermenselijker en ook wat mij betreft geen vermenselijkende

54
00:04:29,800 --> 00:04:32,760
taal gebruiken zoals liegen, hallucineren.

55
00:04:32,760 --> 00:04:40,200
Want daarmee zet je het voor jezelf in een verkeerd daglicht.

56
00:04:40,200 --> 00:04:43,960
Voor degene die de spullen ontvangt in een verkeerd daglicht.

57
00:04:43,960 --> 00:04:45,280
Het ding maakt fouten.

58
00:04:45,280 --> 00:04:48,080
En daar moet je op letten.

59
00:04:48,080 --> 00:04:49,240
Daar moet je wat mee.

60
00:04:49,240 --> 00:04:51,040
Maar dat is aan ons.

61
00:04:51,040 --> 00:04:58,160
Als het goed is gaan de leveranciers van dit soort middelen, dit soort gereedschappen,

62
00:04:58,160 --> 00:05:06,040
Die gaan er aan de slag dat de betekenis die gehangen wordt aan antwoorden op de vraag

63
00:05:06,040 --> 00:05:07,240
steeds beter wordt.

64
00:05:07,240 --> 00:05:13,440
Maar de large language models zullen altijd fouten opleveren.

65
00:05:13,440 --> 00:05:16,680
Aan ons is dus hoe ga je met dit soort fouten om.

66
00:05:16,680 --> 00:05:20,040
Zeker, wat ik nog een keer zeg, als je het in productie wil gebruiken.

67
00:05:20,040 --> 00:05:22,920
Dank je weer voor het luisteren.

68
00:05:22,920 --> 00:05:23,920
Vergeet je niet te abonneren.

69
00:05:23,920 --> 00:05:29,400
En wil je nog wat weten over de honden die kunnen liegen, blijf dan even hangen.

70
00:05:29,400 --> 00:05:31,440
Dan vertel ik wat eventjes.

71
00:05:31,440 --> 00:05:33,720
Ik had twee honden.

72
00:05:33,720 --> 00:05:40,520
Voor de hondenliefhebbers een Rhodesian Ridgeback en een Cruising Mechelsen Heddar.

73
00:05:40,520 --> 00:05:43,840
En je moet weten dat dat allebei best wel waakhonden zijn.

74
00:05:43,840 --> 00:05:52,400
En als ik ze allebei een bot gaf, dan had de Ridgeback, die was daar zo op, dus die

75
00:05:52,400 --> 00:06:00,560
had eigenlijk zo dat bot op en dan was zij, want het was een vrouwtje, jaloers op de meggelse

76
00:06:00,560 --> 00:06:03,360
herder dat die dan nog zijn bot had.

77
00:06:03,360 --> 00:06:09,760
En wat ze dan deed, was eerst bij de kast gaan zitten waar normaal gesproken de hondensnoepjes

78
00:06:09,760 --> 00:06:10,760
uitkwamen.

79
00:06:10,760 --> 00:06:14,040
Dan gingen ze er strak voor zitten en dan reageerde hij op.

80
00:06:14,040 --> 00:06:17,280
Ging hij daar naartoe, hup, zij naar de bot.

81
00:06:17,280 --> 00:06:20,880
Maar dat had hij wel na twee, drie keer had hij dat in de gaten.

82
00:06:20,880 --> 00:06:25,720
Wat deze vervolgens, en wat ik al zei, het zijn wakenhonden.

83
00:06:25,720 --> 00:06:28,440
Dus wat zij deed, is rennen naar de keuken.

84
00:06:28,440 --> 00:06:29,440
Daar staan blaffen.

85
00:06:29,440 --> 00:06:33,200
En dat waken, dat zit zo diep in zijn instinct.

86
00:06:33,200 --> 00:06:36,520
Dus dan moest hij wel rennend, blaffend naar de keuken.

87
00:06:36,520 --> 00:06:38,400
Stond hij in het wilde weg te blaffen.

88
00:06:38,400 --> 00:06:39,400
Zij draaiden zich om.

89
00:06:39,400 --> 00:06:41,120
Huppatee, bordje te pakken.

90
00:06:41,120 --> 00:06:46,440
Dus wat dat betreft, liegen, bedriegen, is blijkbaar niet alleen menselijk.

91
00:06:46,440 --> 00:06:47,640
Honden kunnen dat ook.