OpenAI lanceert o1: een nieuw model dat kan redeneren!

18.000+ lezers blijven up-to-date over artificial intelligence door 'Trending in Tech' te lezen.

Sep 12, 2024

Pats! Een nieuwe editie van Trending in Tech. Dé Nederlandse nieuwsbrief over de impact van artificial intelligence op mens, werk, bedrijf en samenleving. 18K+ abonnees inmiddels.

Deze nieuwsbrief is gratis, maar kost tijd om te maken. Help mij door ‘m door te sturen naar een collega of iemand anders in je netwerk. Bedankt!

Veel leesplezier!

met hartelijke groet, Jarno Duursma

Model o1

OpenAI heeft zijn nieuwste AI-model, o1, zojuist gelanceerd. Dit model is in staat om te ‘redeneren’. Een probleem te ontleden in meerdere stappen om zo tot een oplossing te komen. (chain-of-thought).

Wij mensen kunnen goed redeneren. We doen het vaak snel en automatisch. Maar we kunnen maar een paar stappen redeneren uit ons blote hoofd.

Bijvoorbeeld het probleem: Je wilt je auto parkeren bij jou in de straat. Er is nog een lege plaats. Chain of thought is hoe je naar de oplossing denkt.

1.Je rijdt je auto naar de desbetreffende plaats. 2.Je zet je auto in de reverse versnelling. 3.Je draait het stuur naar rechts. 4.Je draait het stuur naar links. 5. Je remt op tijd. 6. Je zet de auto uit.

Dit is een simpel voorbeeld om aan te geven wat chain of thought is, maar een AI systeem die kan redeneren betekent dat het betere antwoorden kan geven op nog veel complexere vragen. Bijkomend voordeel is ook dat het systeem transparant kan zijn over hoe 't tot zijn antwoorden is gekomen. Beide goed nieuws.

Daarnaast belooft OpenAI dat deze nieuwe modellen minder last hebben van hallucinaties/ verzinsels, hoewel het nog niet is opgelost.

o1 is dus echt een model voor moeilijkere vraagstukken en betere antwoorden.

Denk aan research en development (medicijnen), wetenschappelijk onderzoek (quantum computing), onderzoeken van hypotheses (financiële analyses)

Het o1 model is ook goed in wiskunde en programmeren. Zo heeft o1 tijdens een test voor de Internationale Wiskunde Olympiade maar liefst 83% van de opgaven goed beantwoord. Ter vergelijking: GPT-4o kwam niet verder dan 13%. Ook scoorde o1 hoger in online programmeerwedstrijden.

Nog wel beperkingen

Er is wel een nadeel—het nieuwe model is langzamer dan GPT-4o. Eerder deze week lekte al uit dat o1, dat de codenaam Strawberry had, vaak tussen de 10 en 20 seconden nodig heeft om na te denken, terwijl GPT-4o bijna meteen met een antwoord komt. En: voorlopig enkel beschikbaar voor betalende gebruikers van Plus en Team.

Hoewel o1 minder hallucineert, doet het het nog niet beter dan GPT-4o als het gaat om feitelijke informatie over de wereld. Het model kan ook nog steeds geen internetdata gebruiken of afbeeldingen en bestanden verwerken. Het verwerkt alleen tekst. In veel gevallen is GPT-4o voorlopig dus nog nuttiger.

Maar als je complexe redeneringsvraagstukken hebt, is dit model echt een stap vooruit. En niet te vergeten: dit is versie o1, .. de eerste van velen.

…. en dan ander nieuws:

Generatieve AI bespaart 4500 developer dagen.

In een LinkedIn post schrijft Andy Jassy, de CEO van Amazon dat generatieve AI helpt met enorme tijd- en kostenbesparing in het bedrijf.

Door hun GenAI tool in te zetten voor het updaten van oude Java computercode worden enorme tijdswinsten geboekt. Volgens de CEO van Amazon gaat het om 4500 developer dagen in totaal.

- "Waar een developer eerder 50 dagen over deed is door AI gereduceerd tot een paar uur"
- En dat niet alleen. Van de code die hun GenAI tool genereert, nemen developers maar lieft 79% klakkeloos over. Zo goed werkt het systeem.
- De upgrades hebben daarnaast ook nog eens geleid tot een efficiency winst van $260 miljoen per jaar(!). (waarschijnlijk hosting of cloud service kosten).

Een prachtige usecase van hoe generatieve AI economische waarde toevoegt.

Rapport → Korte Podcast

Heerlijk dat een lang rapport nu makkelijk omgezet kan worden in een hele korte podcast van een paar minuten. Met Google Illuminate.

Google Illuminate is een AI-tool die een wetenschappelijk rapport omzet in een tweegesprek, een soort podcast. De AI-stemmen bespreken het rapport alsof ze het allebei hebben gelezen en willen het zo helder mogelijk aan jou overbrengen. Check de video!

Ik heb een aantal voorbeelden gehoord en ik moet zeggen dat ik echt enthousiast ben.

Soms vind ik luisteren namelijk veel fijner dan lezen. Soms is lezen niet eens een optie, bijvoorbeeld als ik in de auto zit. En op deze manier kan ik zelfs ingewikkelde AI-rapporten snel en eenvoudig tot me nemen. In hun oorspronkelijke PDF-vorm zijn die rapporten vaak uitgebreid en complex.

Wat een uitkomst!

Illuminate biedt nu nog maar een paar AI-rapporten aan, maar dat zal natuurlijk uitbreiden en uiteindelijk een (betaalde) dienst worden.

Dit is software waar ik enthousiast over ben. Ik heb me direct ingeschreven voor de wachtlijst!

…………….. tot de volgende ‘Trending in Tech’!

Trending in Tech