GPT-4, magische remixen en een afbeeldingsfluisteraar.
Stormachtige ontwikkelingen op het gebied van generatieve AI. Trending in Tech #214
Hallo allemaal!
Hier is weer een nieuwe editie van Trending in Tech. Dé nieuwsbrief over de impact van cutting-edge technologie op mens, werk, bedrijf en samenleving.
Alle teksten zijn door Jarno geschreven, niet door ChatGPT. ;-)
Inhoud van Trending in Tech #214:
GPT-4 release: Dit is de samenvatting.
GPT-4: Van schets op papier naar functionele website.
GPT-4: Redeneren over een afbeelding.
Kritische vraag over image-to-text object recognition.
Google & Generative AI producten. Wat een lijst.
Nike & Harry Potter: Remixen van de realiteit.
MidJourney versie 5: AI maakt fotorealistische afbeeldingen.
Meer leesvoer.
Veel plezier met de insights. Tot de volgende keer!
met hartelijke groet, Jarno Duursma
ps: Abonneren op de ‘Trending in Tech’ nieuwsbrief of op de ‘Signals from the future’ (ENG) op Linkedin
ps: Ik geef ook lezingen over dit onderwerp: ChatGPT en creatieve machines of vraag een vrijblijvende offerte aan.
Trending in Tech
Je hebt het vast wel gehoord. OpenAI heeft GPT-4 gelanceerd. Het is de opvolger van GPT-3.5, de huidige basis van ChatGPT.
GPT-4 is een nieuw AI-model dat zowel tekst als afbeeldingen kan begrijpen. En dus teksten kan schrijven.
Samenvatting GPT-4:
-- GPT-4 kan relatief complexe afbeeldingen interpreteren , zoals het identificeren van een Lightning Cable-adapter die op een iPhone is aangesloten. Het kan zelfs recepten voorstellen op basis van een foto van de inhoud van je koelkast. Het kan zelfs een website maken op basis van een schets (zie bericht hieronder)
-- GPT-4 heeft op "menselijk niveau" gepresteerd op verschillende professionele en academische benchmarks.
-- Het kan 25.000 woorden invoeren en schrijven. Samenvatting is beter!
-- OpenAI heeft geen specifieke details bekendgemaakt over de constructie van GPT-4, zoals de gebruikte gegevens, rekenkracht of trainingstechnieken. Best wel suf voor een bedrijf dat “Open” is begonnen. OpenAI is nu een 100% commercieel bedrijf.
-- Ondanks de vooruitgang heeft GPT-4 nog steeds beperkingen. Het "hallucineert" af en toe en maakt fouten, soms met grote overtuiging.
-- GPT-4 is nu beschikbaar voor betalende gebruikers via ChatGPT Plus en Microsoft heeft bevestigd dat zijn Bing Chat-chatbot op GPT-4 draait.
Meer hieronder: ⬇️
GPT-4: Van schets op papier naar functionele website.
Van een schets op een papiertje maakt GPT-4 een functionele website.(HTML/CSS/JS). Dit was te zien in de demonstratie op dinsdag. Dus je maakt een schets op papier, maakt een foto daarvan en GPT-4 schrijft vervolgens de (werkende) code om die website te maken. Wanneer je dit idee extrapoleert, dan zijn de mogelijkheden enorm. Websitebouwers opgelet.
GPT-4: Redeneren over een afbeelding.
Je kunt een afbeelding aan de nieuwe GPT-4 laten zien, waarna het de afbeelding kan interpreteren. Vervolgens kun je een gesprek starten met GPT-4 over de afbeelding; Het systeem kan "reflecteren" op visuele content (image-to-text object recognition).
Een soort afbeeldingsfluisteraar.
Je kunt GPT-4 bijvoorbeeld een foto geven van de inhoud van je koelkast en dan vragen wat je met deze ingrediënten voor gerecht kunt maken. Het systeem geeft je dan een aantal suggesties. GPT-4 kan bijvoorbeeld webpagina's analyseren en het belangrijkste deel voorlezen of samenvatten voor blinden en slechtzienden. Het kan in de toekomst misschien het onderwijs verbeteren door uitleg te geven over visuele inhoud in studieboeken of presentaties.
Kritische vraag over image-to-text object recognition.
➡️ Dan toch even een kritische vraag: wanneer kunstmatig intelligente software in staat is om informatie te distilleren uit een afbeelding en daarover met ons in gesprek te gaan: wat betekent dit? Is het op korte termijn dan ook in staat om te leren van alle YouTube video's ter wereld? En daarop te 'reflecteren'? Dat zou spectaculair zijn. Dan heeft het onwijs veel input om van te leren en kan het een forse bron van informatie zijn. Zou je t.z.t. dan ook vragen kunnen stellen over verbanden tussen meerdere video's? Of over tegenstrijdigheden in video's (MH370, Bestorming van het Capitool)? Of vragen naar interpretaties van bepaalde onderdelen in verschillende video's? Of zal een AI-systeem altijd beperkt blijven in 'begrip'?
Ik vraag me af: hoe ver gaat deze ontwikkeling? Hoe slim gaat dit soort software uiteindelijk worden? Gaat het een groot (commercieel) AI-systeem dan echt een 'model' van de fysieke wereld ontwikkelen op basis van al onze afbeeldingen en video's? Dan kan het wel eens hard gaan met de ‘intelligentie’ van dit soort software. Misschien loop ik te hard van stapel, maar ik vraag me dan ook af: waar staat deze software over 3, 5 of 10 jaar?
Google & Generative AI producten.
Naast OpenAI heeft ook Google flink wat aankondigingen gedaan op het gebied van “generatieve AI” in Google Workspace. (Video) Gebruik je Gmail, Google docs of een andere Google dienst? Let dan op.
Gmail:
Samenvatting van e-mail correspondentie.
De AI-software gaat je antwoord schrijven; inclusief:
- Toon aanpassen van je e-mail (“formeel taalgebruik”)
- E-mail laten uitbreiden door AI.
- E-mail schrijven in bulletpoints.
Google Docs
Rapport schrijven op basis van een e-mail conversatie.
Samenvatten van tekst in Google docs.
Herschrijven, parafraseren van tekst.
Presentaties
Een presentatie maken op basis van een Google doc.
Slides laten ontwerpen op basis van Text-to-image.
Google Meet:
Notities schrijven op basis van inhoud van een meeting.
Actiepunten schrijven.
Google Sheets:
Unieke, gepersonaliseerde e-mail formuleren voor een klanten database.
ps: Developers willen misschien nog even kijken naar Generative AI App Builder
Nike & Harry Potter: Remixen van de realiteit.
𝐈𝐧𝐬𝐩𝐢𝐫𝐞𝐫𝐞𝐧𝐝: Combinatie van NIKE Air Force 1 en Harry Potter Hogwarts: Slytherin, Ravenclaw, Hufflepuff en Gryffindor. Gemaakt door een fan van Nike.
AI-software tools stellen nu iedereen in staat om digitale media te remixen, van merken en films tot beroemdheden, kleding, elektronica, auto's en sport. Dit leidt tot het remixen van de realiteit.
Hoe gaaf zou het zijn wanneer deze sneakers in productie zouden worden genomen? Of zit Nike niet te wachten op dit soort variaties? Krijgen we juridische gevechten over intellectueel eigendom?
Midjourney versie 5: AI maakt fotorealistische afbeeldingen.
AI-software Midjouney maakt fotorealistische afbeeldingen. ⬆️ Dit is versie 5 van de software. Midjourney bestaat nu 1 jaar. Wat zal de stand van zaken zijn over een jaar?
Toen de fotografie opkwam was het vervolgens minder belangrijk om realistisch te kunnen schilderen en ontstond de moderne kunst met surrealisme en kubisme. En tegelijkertijd ontstond er een herwaardering voor het realistisch kunnen schilderen met de hand. Kijk naar de waardering voor de schilderijen van Henk Helmantel bijvoorbeeld.
Met de opkomst van door AI gegenereerde fotorealistische afbeeldingen.. wat zal er nu veranderen?
We weten vanaf nu in ieder geval niet meer of de foto’s die we online zien “echt” of “nep” zijn…
Meer leesvoer:
Generative AI: Applications in for Everyday Consumers -
The Rise of Synthetic Video: An In-Depth Look At How AI Will Transform Video Creation
The ultimate list of AI tools for creators.
Bedankt!
Bedankt weer voor het lezen van mijn Trending in Tech nieuwsbrief. Heb je feedback? Laat het mij weten.
Ben je nog niet geabonneerd maar zou je dat wel graag willen? Klik dan hier.
Kijk ook eens naar mijn Engelstalige nieuwsbrief op LinkedIn ‘Signals from the Future’ (7.300+ abonnees).