S05E26 - Grote AI-taalmodellen onder de loep: EU AI Act beoordeling Artwork

AIToday Live

AIToday Live deelt praktijkverhalen over AI die je direct vooruit helpen in je werk. In een wereld waar AI-ontwikkelingen elkaar razendsnel opvolgen, kiezen wij bewust voor verdieping en praktijkervaring. We bieden een kalm kompas in turbulente tijden.

In deze podcast hoor je professionals uit Nederland en België die openhartig vertellen over hun ervaringen met AI-implementaties. Voorbij de hype en krantenkoppen laten zij zien hoe organisaties écht met AI werken.

Onze gasten delen hun successen én uitdagingen op een toegankelijke manier.

Daarmee helpen we jou om:

Praktische inzichten te krijgen in wat AI wel en niet kan
Te leren van de ervaringen van andere professionals
Concrete ideeën op te doen voor je eigen organisatie
De grotere lijnen te zien in AI-ontwikkelingen

Iedere maandag een diepgaand gesprek met een gast, gepresenteerd door Joop Snijder (CTO Aigency) en Niels Naglé (Info Support). Elke donderdag deelt Joop in een korte aflevering zijn eigen praktijkervaringen en inzichten.

"AIToday Live is uitgeroepen tot AI Podcast of the Year 2025 en is drie keer genomineerd voor 'De Prijs van Oranje' door de Belgian Podcast Awards en staat op nummer 1 in de lijst van Zomerse luister-inspiratie: podcasts over AI, productiviteit, SEO & meer (Frankwatching, juni 2024)."

Ontdek hoe andere professionals AI succesvol inzetten. Ontvang ook exclusieve content, kijk achter de schermen en blijf op de hoogte van nieuwe gasten via onze nieuwsbrief: https://aitodaylive.substack.com

All Episodes

AIToday Live

S05E26 - Grote AI-taalmodellen onder de loep: EU AI Act beoordeling

June 22, 2023 • Info Support AIToday • Season 5 • Episode 26

0:00 | 5:25

Ontdek hoe toonaangevende aanbieders zoals OpenAI, Google, Meta en Hugging Face omgaan met de uitdagingen op het gebied van databrontransparantie, auteursrecht, energieverbruik en risicobestrijding.

Zijn deze bedrijven al klaar voor de veranderende wetgeving en wie komt er als beste uit de bus in deze aflevering?

Tune in en blijf op de hoogte van alle ontwikkelingen in dit fascinerende en snel veranderende gebied van AI.

Mis de laatste inzichten niet en abonneer je vandaag nog op de AIToday Live Shorts podcast!

Bronnen

Stuur ons een bericht

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Schrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!

1
00:00:00,000 --> 00:00:05,000
Dit is AIToday Live Shorts met de actualiteit van AI in 5 minuten.

2
00:00:05,000 --> 00:00:12,000
Met in deze aflevering in hoeverre de taalmodellen van grote leveranciers in overeenstemming zijn met de EU AI Act.

3
00:00:12,000 --> 00:00:20,000
Vorige week heb ik het gehad over de algemene impact van de aangenomen wettext door het Europees Parlement.

4
00:00:20,000 --> 00:00:28,000
Vandaag wil ik juist ingaan op de aanbieders van large language models en hoe zij momenteel nu wel of niet voldoen aan de voorgestelde wet.

5
00:00:28,000 --> 00:00:32,900
Grote taalmodellen zullen als hoog risico worden beschouwd en daarom moeten aanbieders

6
00:00:32,900 --> 00:00:36,220
van deze modellen mogelijke risico's beoordelen en beperken.

7
00:00:36,220 --> 00:00:39,900
Het niet naleven van deze verplichtingen kan leiden tot hoge boetes.

8
00:00:39,900 --> 00:00:44,800
Dit zijn slechts enkele van de verplichtingen die voortvloeien uit het aangenomen voorstel

9
00:00:44,800 --> 00:00:46,420
voor Large Language Models.

10
00:00:46,420 --> 00:00:52,140
Wat interessant is, is dat onderzoekers van Stanford University die hebben die wettekst

11
00:00:52,140 --> 00:00:58,500
hebben ze doorgespit en hebben daar 12 categorieën uit geïdentificeerd van verplichtingen die van

12
00:00:58,500 --> 00:01:03,900
toepassing zijn juist op large language models. Laten we naar de vier belangrijkste aanbieders

13
00:01:03,900 --> 00:01:09,820
kijken en dat zijn OpenAI in combinatie met Microsoft, Google, Meta en Hugging Face.

14
00:01:09,820 --> 00:01:16,500
En ik pak vier onderscheidende categorieën eruit om daar dieper naar te kijken. Aan het eind kijken

15
00:01:16,500 --> 00:01:21,580
we naar de aanbieder en model die het best voltoet aan de AI Act. Dus wie is de nummer 1? Blijf

16
00:01:21,580 --> 00:01:28,580
We beginnen met de categorie databronnen. Meta en Hugging Face scoren de volle 5 van de 5 punten.

17
00:01:28,580 --> 00:01:36,580
Zij zijn open over hun databronnen. Open AI scoort hier het laagst met slechts 1 punt omdat zij niet transparant zijn over hun data.

18
00:01:36,580 --> 00:01:42,580
Wat betreft het trainen op auteursrechtelijk beschermd materiaal krijgt alleen Hugging Face 4 punten.

19
00:01:42,580 --> 00:01:49,580
De overige leveranciers moeten hier nog grote stappen maken aangezien hun modellen hoogstwaarschijnlijk data bevatten waarop auteursrecht rust.

20
00:01:49,580 --> 00:01:56,740
de rust. Hoogstwaarschijnlijk, ik denk wel, bijna wel zeker. En de Washington Post die heeft namelijk

21
00:01:56,740 --> 00:02:04,620
gekeken naar Google's C4 dataset en dat is een dataset met erin een snapshot van de inhoud van

22
00:02:04,620 --> 00:02:10,220
zo'n 15 miljoen websites en waarschijnlijk hebben deze taalmodellen er allemaal gebruik van gemaakt.

23
00:02:10,220 --> 00:02:16,820
gemaakt. En heel hoog op deze lijst staat een website waar illegale boeken op staan.

24
00:02:16,820 --> 00:02:26,100
Dus de kans is heel groot dat er is getraind op al het content van deze illegale boeken.

25
00:02:26,100 --> 00:02:34,340
Sterker nog, bij het analyseren zag de Washington Post ook dat het copyright teken zo'n 200 miljoen

26
00:02:34,340 --> 00:02:39,580
keer voorkwam in die C4 dataset. Het energieverbruik is ook een belangrijk

27
00:02:39,580 --> 00:02:47,260
aspect. Hier hebben OpenAI en Google vooral grote uitdagingen. Zij scoren echt slecht

28
00:02:47,260 --> 00:02:55,380
op dit gebied, terwijl Meta en Hugging Face hier goed scoren, blijkbaar uit het onderzoek

29
00:02:55,380 --> 00:03:01,740
van Stanford. De laatste categorie voor vandaag is risicobestrijding. De leveranciers dienen

30
00:03:01,740 --> 00:03:06,700
de risico's te identificeren die redelijke wijze te voorzien zijn en daarop dan passende

31
00:03:06,700 --> 00:03:12,100
maatregelen te nemen om deze risico's te beperken en de maatregelen te documenteren.

32
00:03:12,100 --> 00:03:17,220
Meta scoort hier het laagst met heel opvallend slechts één punt en vooral gezien het feit

33
00:03:17,220 --> 00:03:21,140
dat het verminderen van discriminatie en het voorkomen van illegale content belangrijke

34
00:03:21,140 --> 00:03:25,620
aspecten in de wet zo direct zijn. Meta heeft duidelijk nog een inhaalslag te maken op dit

35
00:03:25,620 --> 00:03:32,460
gebied. In een bedrijfsmatige setting zal dit wat mij betreft een enorm probleem zijn. Er zullen

36
00:03:32,460 --> 00:03:36,740
altijd risico's verbonden zijn aan het gebruik van de uitkomsten van large language models,

37
00:03:36,740 --> 00:03:42,220
maar deze moeten wel, deze risico's moeten wel aanvaardbaar en beheersbaar zijn. En zoals

38
00:03:42,220 --> 00:03:50,620
Meta nu scoort, hoei! Laten we alles bij elkaar optellen en eens kijken wie is er nu de nummer 1.

39
00:03:50,620 --> 00:03:58,700
Wie heeft de meeste overeenstemming met de AI-act? We gaan van plek 4 naar nummer 1. Als we naar de

40
00:03:58,700 --> 00:04:04,300
Als we naar de totaalscoren kijken, scoort Meta met een model Lama, het laagst, namelijk

41
00:04:04,300 --> 00:04:07,140
21 van de maximaal 48 punten.

42
00:04:07,140 --> 00:04:10,940
Ze staan het verst af van het voldoen aan de EU-act.

43
00:04:10,940 --> 00:04:11,940
Text.

44
00:04:11,940 --> 00:04:19,740
Net daarboven eindigt OpenAI's ChadGPT met 4 punten meer, namelijk 25 punten.

45
00:04:19,740 --> 00:04:24,620
OpenAI scoort vooral slecht op het gebied van energieverbruik en het beschermen van

46
00:04:24,620 --> 00:04:25,620
auteursrechten.

47
00:04:25,620 --> 00:04:30,860
Op de tweede plaats met bijna dezelfde uitdaging op het gebied van energieverbruik en auteursrechten

48
00:04:30,860 --> 00:04:34,580
vinden we Google's PAM 2 met 27 punten.

49
00:04:34,580 --> 00:04:39,700
De duidelijke nummer 1 die momenteel het meest in overeenstemming is met de AI Act is Huggings

50
00:04:39,700 --> 00:04:40,700
Face Blue.

51
00:04:40,700 --> 00:04:44,460
Zij behalen 36 punten van de maximale 48.

52
00:04:44,460 --> 00:04:49,340
Dit komt vooral door het open karakter van hun oplossing waarbij duidelijk wordt aangegeven

53
00:04:49,340 --> 00:04:50,420
welke data is gebruikt.

54
00:04:50,420 --> 00:04:56,420
Belangrijk is om te weten dat de wet na verwachting pas in 2026 van kracht zal gaan.

55
00:04:56,420 --> 00:05:00,420
Het is echter van belang om je nu alvast voor te bereiden op deze wetgeving.

56
00:05:00,420 --> 00:05:05,420
Voor meer details en het volledige rapport verwijs ik graag naar de show notes

57
00:05:05,420 --> 00:05:10,420
en links die ik beschikbaar zal stellen in de beschrijving van deze podcast aflevering.

58
00:05:10,420 --> 00:05:13,420
Hopelijk ben je heel veel wijzer geworden.

59
00:05:13,420 --> 00:05:18,420
Vergeet je niet te abonneren via je favoriete podcast app en mis geen aflevering.

60
00:05:18,420 --> 00:05:19,420
Dankjewel!

61
00:05:19,420 --> 00:05:25,420
[Muziek]

Joop Snijder

Host

Niels Naglé

Co-host