Sora text-to-video: nieuwe voorbeelden.
15.000+ lezers blijven up-to-date over artificial intelligence door 'Trending in Tech' te lezen.
Hallo allemaal!
Hier is weer een nieuwe editie van Trending in Tech. Dé nieuwsbrief over de impact van artificial intelligence op mens, werk, bedrijf en samenleving. Meer dan 15K abonnees inmiddels.
Stuur ‘m door naar een collega, vriend of iemand anders uit je netwerk. Dank!
Veel leesplezier!
met hartelijke groet, Jarno Duursma
Sora text-to-video: nieuwe voorbeelden.
Sora, de text-to-video software van OpenAI blijft maar verbazen. Er zijn steeds meer gave voorbeelden online te vinden. Check deze Twitter thread voor een aantal gave nieuwe voorbeelden. Realistisch, consistent en scherp.
We gaan een explosie krijgen van creatieve video, net zoals we het afgelopen jaar dat hebben gezien bij hyper-creatieve afbeeldingen door text-to-image software zoals Midjourney of Dall-E.
Je hebt een idee in je hoofd voor een video of film en je kunt het in de toekomst maken met Sora of vergelijkbare tools.
Google Gemini ‘begrijpt’ video.
Google's nieuwste Gemini-update is bizar: het kan nu de inhoud van video's "begrijpen" en gedetailleerd rapporteren over wat er in een video gebeurt, zoals het moment dat een papiertje uit een zak wordt gehaald. Dit is een enorme sprong in beeldherkenningstechnologie. Dit gaat echt van betekenis zijn in de toekomst bij het zoeken in media, surveillance door bedrijven en overheden, en zelfs het analyseren van alle YouTube-video's wereldwijd. Een toekomst waarin AI-software ons digitale spiegelbeeld kan bekijken is niet langer science fiction.
Wat is Retrieval-Augmented Generation (RAG)?
Veel AI-liefhebbers in mijn omgeving praten de laatste tijd over Retrieval-augmented generation (RAG). Het is vooral nu nog een nerd ding. RAG is een relatief nieuwe techniek om het ‘hallucineren’ in grote taalmodellen tegen te gaan. Zodat ChatGPT minder onzin gaat vertellen zeg maar.
De LLM fungeert als de “basis” van het systeem (die taal begrijpt en verwerkt), terwijl de RAG-component de mogelijkheid creëert om externe, actuele informatie op te halen en in de antwoorden op te nemen. Daarvoor wordt een externe database als bron gebruikt bij het produceren van antwoorden. Dit helpt om betere, actuele en betrouwbaardere antwoorden te genereren. Omdat de externe database goede informatie bevat, maar ook omdat je kunt zien waar de informatie vandaan komt. RAG is makkelijk te gebruiken en niet duur. Of het de gouden oplossing is dat weten we niet. Hier de uitleg, hier het enthousiasme, hier wat voorbeelden en hier de kritische noot.
Allemaal een digitale butler op onze computer?
Uiteindelijk krijgen we allemaal een LLM assistent op onze computer en smartphone die ook offline te gebruiken is. Je kunt je eigen LLM dan specifiek gebruiken om informatie te halen uit jouw eigen documenten en je eigen e-mail. En het systeem kan voor jou zoeken op het internet naar informatie en een reeks taken voor je uitvoeren op iedere website of in iedere app. Een echte ‘digitale butler’ dus. Jan.ai is een open source initiatief die dat probeert te bewerkstelligen. LINK.
ChatGPT Temporary Chat
Binnenkort krijgt ChatGPT een nieuwe functie: 'Temporary Chat'.
Wat je in zo'n chat zegt, wordt niet opgeslagen in je geschiedenis, en ChatGPT onthoudt de inhoud van het gesprek niet. De input wordt ook niet gebruikt om ChatGPT te trainen. Deze feature lijkt dus gemaakt te zijn zodat je ook meer gevoelige informatie kunt gebruiken binnen ChatGPT. (Dat lijkt mij prima, maar wat echt, echt geheim moet blijven zou ik persoonlijk ook niet delen met ChatGPT of Microsoft). Hier meer info.
Bedankt voor het lezen van Trending in Tech. Vergeet niet om ‘m door te sturen naar je collega’s!