1
00:00:00,000 --> 00:00:13,000
Het is vandaag 30 november en het is de verjaardag van ChatGPT.

2
00:00:13,000 --> 00:00:17,080
Een jaar geleden kwam het uit en daar gaat natuurlijk een hoop veranderen.

3
00:00:17,080 --> 00:00:20,880
Mijn leven is in ieder geval veranderd, mijn werkende leven.

4
00:00:20,880 --> 00:00:25,640
En het is denk ik wel leuk om juist terug te kijken van hoe zijn we hier gekomen.

5
00:00:25,640 --> 00:00:37,280
Want het hangt nogal van een aantal toevalligheden aan elkaar, onverwachte wendingen waarop we

6
00:00:37,280 --> 00:00:39,080
op dit punt zijn gekomen.

7
00:00:39,080 --> 00:00:44,280
Want als dit een aantal dingen niet gebeurd zouden zijn, zou OpenAI nu niet zijn waar

8
00:00:44,280 --> 00:00:45,280
ze nu zouden zijn.

9
00:00:45,280 --> 00:00:52,600
En om zo direct vooruit te kijken moeten we eigenlijk even denken aan Winston Churchill

10
00:00:52,600 --> 00:00:56,880
die zei hoe langer je terug kunt kijken, hoe verder je vooruit kunt kijken.

11
00:00:56,880 --> 00:01:01,440
Dus laten we vandaag eens terugkijken op de verjaardag van ChatGPT.

12
00:01:01,440 --> 00:01:09,960
Je zou kunnen zeggen dat de oorsprong van deze technologie begint bij Google Translate.

13
00:01:09,960 --> 00:01:15,880
Google Translate ging er natuurlijk om om dingen te vertalen.

14
00:01:15,880 --> 00:01:17,840
Dus van de ene taal naar de andere taal.

15
00:01:17,840 --> 00:01:20,600
En dat werkte in het begin behoorlijk matig.

16
00:01:20,600 --> 00:01:27,040
Als je dat in het begin gebruikte, merkte je dat het meer een soort van woord voor woord

17
00:01:27,040 --> 00:01:28,240
vertalen was.

18
00:01:28,240 --> 00:01:31,920
En die best wel hele slechte resultaten gaf.

19
00:01:31,920 --> 00:01:37,360
Tot op een bepaalde dag en een keer de resultaten heel veel beter werden.

20
00:01:37,360 --> 00:01:42,640
En dat had te maken met het zogenaamde sequence to sequence algoritme.

21
00:01:42,640 --> 00:01:46,560
En dit klinkt heel technisch en dat is het ook wel een beetje.

22
00:01:46,560 --> 00:01:56,200
Maar wat hij eigenlijk deed was een tekst gebruiken en die omzetten naar getalletjes.

23
00:01:56,200 --> 00:02:01,240
Dus als een soort van tussentaal waarbij er gekeken werd hoe verhouden de woorden in een

24
00:02:01,240 --> 00:02:02,640
zin zich nou tot elkaar.

25
00:02:02,640 --> 00:02:09,560
En vervolgens kon hij dat eigenlijk weer ontcijferen en daar een andere taal tegenaan houden.

26
00:02:09,560 --> 00:02:12,760
Dus ik gaf bijvoorbeeld in I'm a student.

27
00:02:12,760 --> 00:02:17,040
Daar werden allemaal getalletjes aangekoppeld, zogenaamde vector.

28
00:02:17,040 --> 00:02:21,920
En die konden dan gedecodeerd worden met allerlei andere talen.

29
00:02:21,920 --> 00:02:24,560
Dus dat kon zijn Frans, Nederlands, Duits.

30
00:02:24,560 --> 00:02:26,400
Je kon het zo gek niet verzinnen.

31
00:02:26,400 --> 00:02:30,000
Dus de decoder zou in het Nederlands zeggen ik ben een student.

32
00:02:30,000 --> 00:02:33,800
Nou dat lijkt nog op die woord voor woord vertaling.

33
00:02:33,800 --> 00:02:36,360
Maar in het Frans zou het zijn je suis étudiant.

34
00:02:36,360 --> 00:02:38,360
Als ik dat goed uitspreek.

35
00:02:38,360 --> 00:02:41,280
Het is eigenlijk een hele andere zinsconstructie.

36
00:02:41,280 --> 00:02:46,040
Nou daar zijn ze heel lang mee bezig geweest.

37
00:02:46,040 --> 00:02:50,680
We hebben het hier over 2012 dat dit was.

38
00:02:50,680 --> 00:02:55,320
En op een gegeven moment komt er een paper uit, een wetenschappelijk paper.

39
00:02:55,320 --> 00:02:58,720
En dat paper heet 'Attention is all you need'.

40
00:02:58,720 --> 00:03:02,160
En het gek is, ook weer Google.

41
00:03:02,160 --> 00:03:09,600
Allerlei wetenschappers van Google en de Universiteit van Toronto hebben dan een manier bedacht

42
00:03:09,600 --> 00:03:14,880
dat je zowel naar voren als naar achteren kan kijken.

43
00:03:14,880 --> 00:03:17,640
Waardoor je eigenlijk meer context hebt.

44
00:03:17,640 --> 00:03:24,200
En waarbij de machine die vertaling van het een naar het ander veel beter kan uitvoeren.

45
00:03:24,200 --> 00:03:27,640
Een enorme sprong voorwaarts is dat.

46
00:03:27,640 --> 00:03:32,080
Nou er zijn allerlei bedrijven die hiermee aan de gang gaan.

47
00:03:32,080 --> 00:03:33,080
Waaronder OpenAI.

48
00:03:33,080 --> 00:03:39,060
OpenAI heeft in eerste instantie het idee van ja we gaan onderzoek doen naar Artificial

49
00:03:39,060 --> 00:03:41,060
General Intelligence.

50
00:03:41,060 --> 00:03:44,720
En die bouwen hun eerste GPT.

51
00:03:44,720 --> 00:03:47,520
Dan komt GPT2.

52
00:03:47,520 --> 00:03:51,720
En dan hebben we het eerste toeval te pakken.

53
00:03:51,720 --> 00:03:53,720
Want wat gebeurt er?

54
00:03:53,720 --> 00:03:58,520
Op een dag bij Microsoft krijgen ze een DDoS aanval.

55
00:03:58,520 --> 00:04:04,880
Dat is waarbij servers zo worden bestookt dat ze bijna onderuit gaan of onderuit kunnen

56
00:04:04,880 --> 00:04:05,880
gaan.

57
00:04:05,880 --> 00:04:09,000
En Microsoft analyseert dat natuurlijk.

58
00:04:09,000 --> 00:04:17,280
En heel raar voor hun is in plaats van dat die DDoS aanval vanaf een obscure locatie

59
00:04:17,280 --> 00:04:22,040
kwam, bleek het gewoon van servers uit San Francisco te zijn.

60
00:04:22,040 --> 00:04:25,320
Dus dan gingen ze kijken van wie zit hier nou achter.

61
00:04:25,320 --> 00:04:29,400
Rondbellen bleek OpenAI te zijn.

62
00:04:29,400 --> 00:04:32,760
En die DDoS aanval was namelijk op GitHub.

63
00:04:32,760 --> 00:04:40,160
GitHub is de plek die Microsoft gekocht heeft waar heel veel developers open source code

64
00:04:40,160 --> 00:04:41,160
op zetten.

65
00:04:41,160 --> 00:04:46,520
Dus ze zagen eigenlijk dat OpenAI allemaal programmeercode naar binnen aan het halen

66
00:04:46,520 --> 00:04:47,520
was.

67
00:04:47,520 --> 00:04:49,880
Die was dat aan het scrapen, aan het leegtrekken.

68
00:04:49,880 --> 00:04:54,000
Dus die hebben overlegd van ja wat zijn jullie nou aan het doen?

69
00:04:54,000 --> 00:04:56,160
Waar zijn jullie nou mee bezig?

70
00:04:56,160 --> 00:04:57,440
Lang verhaal kort.

71
00:04:57,440 --> 00:05:01,960
Na een bepaalde periode denkt Microsoft dit zou wel eens wat kunnen worden.

72
00:05:01,960 --> 00:05:05,800
En investeert op dat moment 1 miljard dollar in OpenAI.

73
00:05:05,800 --> 00:05:07,320
Dus groot nieuws.

74
00:05:07,320 --> 00:05:09,920
2019 hebben we het dan over.

75
00:05:09,920 --> 00:05:14,400
En meeste mensen zijn toch wel versteld dat Microsoft hier zoveel geld in stopt.

76
00:05:14,400 --> 00:05:18,320
Nou dan scrollen we eigenlijk een jaar verder.

77
00:05:18,320 --> 00:05:22,200
En dan komt OpenAI uit met GPT-3.

78
00:05:22,200 --> 00:05:24,680
Nog steeds onbekend voor het publiek.

79
00:05:24,680 --> 00:05:29,800
Maar dan geven ze mondjesmaat mensen toegang tot een zogenaamde playground.

80
00:05:29,800 --> 00:05:35,000
En die playground dat is eigenlijk de voorloper, de echte voorloper van chatGPT.

81
00:05:35,000 --> 00:05:36,480
Want dat is een user interface.

82
00:05:36,480 --> 00:05:38,200
Maar nog wel heel technisch.

83
00:05:38,200 --> 00:05:42,320
Waarin je allerlei technische elementen moest instellen.

84
00:05:42,320 --> 00:05:47,080
Zoals de frequency en een inject start text.

85
00:05:47,080 --> 00:05:49,160
En van alles en nog wat.

86
00:05:49,160 --> 00:05:55,120
En omdat dat zo technisch was, kregen we toch minder aandacht en minder tractie.

87
00:05:55,120 --> 00:05:59,440
Ik had het geluk dat ik al eerder toegelaten werd.

88
00:05:59,440 --> 00:06:03,160
Waardoor je zag van dit kan echt wel heel erg groot worden.

89
00:06:03,160 --> 00:06:06,280
Gaan we nog een stapje verder.

90
00:06:06,280 --> 00:06:12,080
En dan waar je ook dat toeval wat er dan gebeurt eigenlijk.

91
00:06:12,080 --> 00:06:17,200
Waardoor dingen heel anders lopen dan misschien de bedoeling was.

92
00:06:17,200 --> 00:06:21,040
Dan krijg je in juni 2020 zijn we dan.

93
00:06:21,040 --> 00:06:24,280
Dan komt er een Google test engineer.

94
00:06:24,280 --> 00:06:29,880
En die zegt, Google die heeft een systeem ontwikkeld.

95
00:06:29,880 --> 00:06:32,840
En dat was eigenlijk een soort van chatGPT.

96
00:06:32,840 --> 00:06:34,720
En die heeft zelfbewustzijn.

97
00:06:34,720 --> 00:06:38,640
Dit wordt groot opgepakt in de media.

98
00:06:38,640 --> 00:06:44,720
En Google is eigenlijk waarschijnlijk hier zo van geschrokken.

99
00:06:44,720 --> 00:06:49,720
Dat ze niet alleen deze test engineer ontslaan.

100
00:06:49,720 --> 00:06:55,240
Maar het project ook in de ijskast zetten of in ieder geval niet naar buiten brengen.

101
00:06:55,240 --> 00:07:00,200
En waar hij mee bezig was, was het testen wat uiteindelijk Google Bart zou worden.

102
00:07:00,200 --> 00:07:05,160
Dus je ziet eigenlijk in de hele historie is het Google, Google, Google.

103
00:07:05,160 --> 00:07:10,040
En toch zijn ze niet de eerste die hier mee naar buiten zijn gekomen.

104
00:07:10,040 --> 00:07:12,200
En daarmee dus ook niet de grootste.

105
00:07:12,200 --> 00:07:17,600
En dan hebben we 30 november 2022.

106
00:07:17,600 --> 00:07:20,400
OpenEye brengt chatGPT uit.

107
00:07:20,400 --> 00:07:25,920
Ze hebben een user interface waardoor je gewoon kan chatten met een taalmodel.

108
00:07:25,920 --> 00:07:29,240
En zij dachten van nou ja weet je, dat zetten we open.

109
00:07:29,240 --> 00:07:32,280
Ze hadden dat gemaakt voor hun eigen testmogelijkheden.

110
00:07:32,280 --> 00:07:38,000
En hebben dat opengezet en verwachten niet dat dit enige aandacht zou krijgen.

111
00:07:38,000 --> 00:07:44,400
En vanaf die dag is het natuurlijk enorm ontploft en zijn we waar we nu zijn.

112
00:07:44,400 --> 00:07:48,360
Microsoft was zelfs geschrokken van hoe moeten we nu gaan schalen.

113
00:07:48,360 --> 00:07:52,760
In het begin kon je nauwelijks accounts aanmaken of was die niet bereikbaar.

114
00:07:52,760 --> 00:07:57,920
Dus het was helemaal niet op voor gesorteerd dat dit zo groot zou zijn.

115
00:07:57,920 --> 00:08:00,400
En dat het zo groot opgepakt zou worden.

116
00:08:00,400 --> 00:08:01,840
Ook een mate van toeval.

117
00:08:01,840 --> 00:08:06,360
Waar ik mee af wil sluiten, want we hebben nu teruggekeken.

118
00:08:06,360 --> 00:08:13,120
En als je nou vooruit kijkt, dan zou je deze hele ontwikkeling moeten zien van 2000.

119
00:08:13,120 --> 00:08:17,400
Nou eigenlijk nog voor 2012, nog veel langer daarvoor.

120
00:08:17,400 --> 00:08:19,400
Vanaf Google Translate tot nu.

121
00:08:19,400 --> 00:08:23,240
Is dat er een soort van spekhoek is gemaakt van technologieën.

122
00:08:23,240 --> 00:08:25,640
Van laagje voor laagje voor laagje.

123
00:08:25,640 --> 00:08:28,800
Die ervoor heeft gezorgd dat we zijn waar we nu zijn.

124
00:08:28,800 --> 00:08:33,120
En die laagjes van zo'n spekhoek is heel erg arbeidsintensief.

125
00:08:33,120 --> 00:08:35,360
En dat zijn deze laagjes ook geweest.

126
00:08:35,360 --> 00:08:39,640
Dus als we nu hele grote doorbraken verwachten, dat is het niet.

127
00:08:39,640 --> 00:08:41,200
We krijgen laagje voor laagje.

128
00:08:41,200 --> 00:08:44,840
Wat wel zo kan zijn, is dat je een aantal van dat soort dingen mist.

129
00:08:44,840 --> 00:08:46,960
En dat je een lekker stuk taart krijgt.

130
00:08:46,960 --> 00:08:47,960
De ChatGPT.

131
00:08:47,960 --> 00:08:52,240
Waarbij je in één keer denkt van wow, dit is echt heel groot, heel nieuw.

132
00:08:52,240 --> 00:08:55,320
Maar bedenk, er zit een grote historie achter.

133
00:08:55,320 --> 00:08:59,400
En zo zal het in de toekomst waarschijnlijk ook gaan.

134
00:08:59,400 --> 00:09:01,200
Dankjewel voor het luisteren.

135
00:09:01,200 --> 00:09:02,680
Hopelijk heb je wat opgestoken.

136
00:09:02,680 --> 00:09:03,960
Tot de volgende keer.

137
00:09:03,960 --> 00:09:05,960
 
138
00:09:05,960 --> 00:09:08,280