S05E19 - Shorts - DragGAN AI in 5 minuten Artwork

AIToday Live

AIToday Live deelt praktijkverhalen over AI die je direct vooruit helpen in je werk. In een wereld waar AI-ontwikkelingen elkaar razendsnel opvolgen, kiezen wij bewust voor verdieping en praktijkervaring. We bieden een kalm kompas in turbulente tijden.

In deze podcast hoor je professionals uit Nederland en België die openhartig vertellen over hun ervaringen met AI-implementaties. Voorbij de hype en krantenkoppen laten zij zien hoe organisaties écht met AI werken.

Onze gasten delen hun successen én uitdagingen op een toegankelijke manier.

Daarmee helpen we jou om:

Praktische inzichten te krijgen in wat AI wel en niet kan
Te leren van de ervaringen van andere professionals
Concrete ideeën op te doen voor je eigen organisatie
De grotere lijnen te zien in AI-ontwikkelingen

Iedere maandag een diepgaand gesprek met een gast, gepresenteerd door Joop Snijder (CTO Aigency) en Niels Naglé (Info Support). Elke donderdag deelt Joop in een korte aflevering zijn eigen praktijkervaringen en inzichten.

"AIToday Live is uitgeroepen tot AI Podcast of the Year 2025 en is drie keer genomineerd voor 'De Prijs van Oranje' door de Belgian Podcast Awards en staat op nummer 1 in de lijst van Zomerse luister-inspiratie: podcasts over AI, productiviteit, SEO & meer (Frankwatching, juni 2024)."

Ontdek hoe andere professionals AI succesvol inzetten. Ontvang ook exclusieve content, kijk achter de schermen en blijf op de hoogte van nieuwe gasten via onze nieuwsbrief: https://aitodaylive.substack.com

All Episodes

AIToday Live

S05E19 - Shorts - DragGAN AI in 5 minuten

May 25, 2023 • Info Support AIToday • Season 5 • Episode 19

0:00 | 6:17

AIToday Live Shorts presenteert een nieuwe AI-toepassing genaamd DragGAN AI, ontwikkeld door onder andere het Max Planck Instituut. DragGAN AI maakt het mogelijk om eenvoudig foto's aan te passen door simpelweg over de afbeelding te slepen en elementen te manipuleren zoals gezichtsuitdrukkingen, objecten en landschappen. Het concept van DragGAN is gebaseerd op Generative Adversarial Networks (GANs) waar twee netwerken samenwerken om realistische afbeeldingen te genereren.

Hoewel DragGAN AI indrukwekkend is, zijn er beperkingen zoals het feit dat het voornamelijk goed werkt met foto's uit de trainingsdata. Ook zijn er discussies rondom privacy en persoonlijkheidsrechten door de mogelijkheid om valse poses en uitdrukkingen te creëren. Op dit moment is er nog geen beschikbare applicatie voor gebruik.

Het idee dat Photoshop overbodig wordt door deze technologie lijkt voorbarig. Het is waarschijnlijker dat DragGAN AI geïntegreerd zou kunnen worden in Photoshop als een extra functie. Kortom, DragGAN AI is een interessante technologie met veel potentieel voor fotobewerking, maar het heeft ook zijn beperkingen. Het is iets om in de gaten te houden voor toekomstige ontwikkelingen in fotobewerking en AI.

Stuur ons een bericht

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Schrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!

1
00:00:00,000 --> 00:00:04,720
Luister naar een nieuwe AIToday Live Short.

2
00:00:04,720 --> 00:00:07,440
Mijn naam is Joop Snijder, CTO bij Aigency.

3
00:00:07,440 --> 00:00:10,880
En vandaag wil ik het hebben over...

4
00:00:10,880 --> 00:00:12,800
DragGAN AI.

5
00:00:12,800 --> 00:00:15,040
Een nieuwe manier van fotobewerking.

6
00:00:15,040 --> 00:00:16,720
Sommigen zeggen...

7
00:00:16,720 --> 00:00:19,520
Nou, misschien is Photoshop wel dood.

8
00:00:19,520 --> 00:00:23,600
Vanwege deze nieuwe manier van AR en fotobewerking.

9
00:00:23,600 --> 00:00:25,920
Laten we eens kijken of dat zo is.

10
00:00:25,920 --> 00:00:28,720
En eerst eens even induiken wat is het?

11
00:00:28,720 --> 00:00:29,920
Hoe werkt het?

12
00:00:29,920 --> 00:00:32,920
en daarna zal ik aangeven wat ik ervan vind.

13
00:00:32,920 --> 00:00:38,040
Nou, DragGAN is een nieuwe AI-app gemaakt door onder andere het Max Planck instituut

14
00:00:38,040 --> 00:00:42,720
waarmee je eenvoudig foto's kunt aanpassen door over de afbeelding te slepen.

15
00:00:42,720 --> 00:00:44,080
Zo simpel is het.

16
00:00:44,080 --> 00:00:46,920
Kijk, je klikt een punt aan op een gezicht

17
00:00:46,920 --> 00:00:49,520
en laat bijvoorbeeld het hoofd draaien

18
00:00:49,520 --> 00:00:53,820
of je laat bijvoorbeeld de persoon lachen. Als je op de mondhoeken klikt

19
00:00:53,820 --> 00:00:55,520
kan je gewoon omhoog trekken

20
00:00:55,520 --> 00:00:57,520
en daarmee laat je de persoon lachen.

21
00:00:57,520 --> 00:01:01,880
Dit soort aanpassingen kunnen ook met objecten zoals auto's om die te draaien

22
00:01:01,880 --> 00:01:09,640
of landschappen waar je de top van de berg aanklikt, omhoog trekt en daarmee vergroot je de berg.

23
00:01:09,640 --> 00:01:12,960
Of je kan de pose van het dier veranderen.

24
00:01:12,960 --> 00:01:19,680
Dit zorgt best wel voor wat ophef, ik weet niet of je het gezien hebt op social media.

25
00:01:19,680 --> 00:01:23,280
Dit alles naar aanleiding van het paper dat heet

26
00:01:23,280 --> 00:01:32,200
Drag your GAN. GAN schrijf je als G A N. Interactive Point Based Manipulation on the Generative

27
00:01:32,200 --> 00:01:41,920
Image Manifold. Oftewel in het Nederlands, sleep je GAN, interactieve manier om puntengebaseerde

28
00:01:41,920 --> 00:01:49,400
manipulatie op generatieve delen van plaatjes te verwijzigen. Hartstikke cool. Waarom?

29
00:01:49,400 --> 00:01:53,400
Waarom? Omdat je namelijk ook niet zichtbare elementen zichtbaar kan maken.

30
00:01:53,400 --> 00:02:00,400
Ze hebben een filmpje getoond waarbij je het hoofd van een leeuw close-up ziet.

31
00:02:00,400 --> 00:02:08,400
Ze openen de bek en dan kijk je ook in de bek van de leeuw en je ziet dan ook gewoon de grote tanden.

32
00:02:08,400 --> 00:02:12,400
Die natuurlijk helemaal niet op de foto aanwezig waren.

33
00:02:12,400 --> 00:02:15,400
Wat zijn nu GANs?

34
00:02:15,400 --> 00:02:20,800
Laten we het daarover hebben op een manier die gemakkelijk te begrijpen is.

35
00:02:20,800 --> 00:02:25,360
Stel je voor dat je van tekenen houdt en heel goed wilt worden in het tekenen van dieren.

36
00:02:25,360 --> 00:02:31,520
Maar soms loop je vast omdat je niet weet hoe je het dier er precies uit kunt laten zien.

37
00:02:31,520 --> 00:02:36,040
Zou het dan niet geweldig zijn als je een speciale vriend had die je kon helpen je tekeningen

38
00:02:36,040 --> 00:02:37,040
te verbeteren?

39
00:02:37,040 --> 00:02:39,080
Daar komen GANS om de hoek kijken.

40
00:02:39,080 --> 00:02:42,840
GAN staat voor Generative Adversarial Network.

41
00:02:42,840 --> 00:02:47,440
Het is alsof je twee vrienden hebt die samenwerken om je te helpen beter te tekenen.

42
00:02:47,440 --> 00:02:50,800
De eerste vriend wordt de generator genoemd.

43
00:02:50,800 --> 00:02:54,320
Het is de taak van de generator om nieuwe tekeningen van dieren te maken.

44
00:02:54,320 --> 00:02:57,360
Maar in het begin zijn deze tekeningen misschien niet erg goed.

45
00:02:57,360 --> 00:03:01,600
Ze zien er misschien helemaal niet uit als echte dieren.

46
00:03:01,600 --> 00:03:04,640
Dat is oké, want de generator is net aan het leren.

47
00:03:04,640 --> 00:03:08,600
Hier komt de tweede vriend, de discriminator.

48
00:03:08,600 --> 00:03:14,140
Die komt dan op de hoek kijken en die is erg goed in het onderscheiden van echte dierenfoto's

49
00:03:14,140 --> 00:03:15,140
en nepfoto's.

50
00:03:15,140 --> 00:03:17,740
Of neptekeningen, zou ik eigenlijk moeten zeggen.

51
00:03:17,740 --> 00:03:23,660
Dus de discriminator kijkt naar tekeningen van de generator en geeft feedback.

52
00:03:23,660 --> 00:03:28,260
Er staat, hmm deze tekening ziet er wel niet nep uit, probeer maar opnieuw.

53
00:03:28,260 --> 00:03:33,700
De generator luistert naar de feedback van de discriminator en probeert een betere tekening

54
00:03:33,700 --> 00:03:34,700
te maken.

55
00:03:34,700 --> 00:03:36,580
Het blijft oefenen en wordt elke keer beter.

56
00:03:36,580 --> 00:03:41,260
En de discriminator blijven naar de nieuwe tekeningen kijken en feedback geven totdat

57
00:03:41,260 --> 00:03:44,700
de tekeningen van de generator steeds meer op echte dieren gaan lijken.

58
00:03:44,700 --> 00:03:51,220
Dit spel blijft de hele tijd heen en weer gaan en ze proberen elkaar te slim af te zijn

59
00:03:51,220 --> 00:03:55,900
waardoor je uiteindelijk dus hele goede dieren kan tekenen.

60
00:03:55,900 --> 00:04:05,980
Dat is dus de basis om dit soort technieken te gebruiken en dit soort dingen te maken.

61
00:04:05,980 --> 00:04:12,980
Misschien ken je de website "this person does not exist" waarbij je iedere keer als je de pagina ververst,

62
00:04:12,980 --> 00:04:17,980
krijg je een nieuwe foto van de mensen zien en die zijn allemaal gegenereerd met dit soort GANs.

63
00:04:17,980 --> 00:04:24,980
Dus het model heeft geleerd om hele goede portretten te maken.

64
00:04:24,980 --> 00:04:31,980
Dat Dragan dat ziet er echt wel heel gaaf uit.

65
00:04:31,980 --> 00:04:40,300
Je kan zelfs delen van een foto selecteren en precies op dat deel wijzigingen aanbrengen

66
00:04:40,300 --> 00:04:43,300
en de rest blijft dan fixed eigenlijk.

67
00:04:43,300 --> 00:04:45,220
Dus je pakt dan alleen dat deel.

68
00:04:45,220 --> 00:04:47,380
Ik denk dat het een heel erg krachtige middel is.

69
00:04:47,380 --> 00:04:55,460
Maar ze schrijven zelf in het paper dat er aardig wat limitaties en discussies zijn.

70
00:04:55,460 --> 00:05:02,140
Ten eerste, het is nog een soort van web app waarbij je je foto in kan geven.

71
00:05:02,140 --> 00:05:08,620
En hij werkt vooral heel goed op de data die in de trainingsdata zit.

72
00:05:08,620 --> 00:05:15,780
Heb jij nou een foto waar ze helemaal niet op hebben getraind, op dat soort foto's,

73
00:05:15,780 --> 00:05:21,140
dan gaat hij helemaal de mist in en dan krijg je ook gewoon echt lelijke structuren erbij.

74
00:05:22,020 --> 00:05:28,660
Als discussie zeggen ze ook van ja, moet je eens kijken, je kan natuurlijk allerlei valse

75
00:05:28,660 --> 00:05:35,660
poses maken, uitdrukkingen, vormen van mensen en je moet dus wel strikt omgaan met persoonlijkheidsrechten

76
00:05:35,660 --> 00:05:37,460
en privacyregels respecteren.

77
00:05:37,460 --> 00:05:45,740
In mijn beleving is het vooral nog een paper met gave video's die de mogelijkheden demonstreren

78
00:05:45,740 --> 00:05:46,740
van deze techniek.

79
00:05:46,740 --> 00:05:50,180
Er is nog geen applicatie die je echt kan proberen.

80
00:05:50,180 --> 00:05:52,020
Photoshop dood, zeker niet.

81
00:05:52,020 --> 00:05:57,780
Sterker nog, lijkt me eerder dat ze dit gaan integreren bij Photoshop als het goed genoeg werkt.

82
00:05:57,780 --> 00:06:04,380
Photoshop kent al neural filters die al dan niet goed werken en die ze in preview uitproberen.

83
00:06:04,380 --> 00:06:09,580
Dus een stap naar kunnen en naar een werkend product is denk ik nog best wel groot.

84
00:06:09,580 --> 00:06:17,700
[Muziek]

Joop Snijder

Host

Niels Naglé

Co-host