Futured Blog
AI News – červenec 2024
Martin Sumera
27. 6. 2024
Věříme, že současný trend AI není jen hype nebo buzzword, ale že představuje zásadní změnu v tom, jak každodenně fungujeme.

V AI News zpřehledňujeme, co se za poslední měsíc událo a jaké mohou mít tyto změny dopad na technologická řešení firem napříč obory. Sledujeme novinky, abyste vy nemuseli.

Přečtení AI News vám zabere 6 minut.

TL;DR

  • Apple Intelligence přináší AI integraci přímo do svého operačního systému. A vypadá to jako krok správným směrem.
  • Anthropic vydává claude-3-5-sonnet, který by mohl překonat všechny benchmarky GPT-4. Oznámil také verzi 3.5 pro ostatní modely z rodiny. Přidává Artefakty, a stává se tak velmi užitečným nástrojem.
  • Měsíc byl ve znamení text-to-video nástrojů: Kling, Luma a Runaway.

Novinky

Apple se s odstupem času připojil k ostatním tech gigantům a oznámil první velké AI novinky ve formě funkcí integrovaných přímo do systému. Ačkoli během keynote AI ani jednou nezmínil, nazval nástroje jako Apple Intelligence (zkratka AI).

Přichází s několika integracemi, které představují kroky vedoucí AI ke koncovým uživatelům.

Siri se dočkala upgradu, díky kterému se stává výrazně rozumnějším nástrojem: Dostává možnost chápat kontext, ve kterém se uživatel nachází, vidět, co dělá, a také vykonávat akce. Spolu s integracemi v rámci aplikací to vypadá na první fajn integraci LLM v rámci většího ekosystému, která má potenciál dostat se k milionům lidí. Zdá se, že Apple správně zvolil balanc – odhadl, co současné LLM nástroje dokáží, a přinesl to koncovým uživatelům ve velmi dostupné formě. I Microsoft se o větší integraci snažil, a to za pomoci recall funkcionality, kterou ale kvůli bezpečnostním hrozbám odkládá na později.

Apple také oznámil spolupráci s OpenAI. V případě, že Apple Intelligence nebude na váš dotaz stačit, zeptá se přímo ChatGPT – předtím se vás ale optá na povolení takovou akci vykonat. Bezpečnost je pro Apple klíčová, a tak v případě, že dotaz odchází z vašeho zařízení, měl by být chráněn nejrůznějšími technikami, aby byl anonymizován do co největší míry.

A povzdychnutí na závěr: Bohužel to vypadá, že v EU nebude Apple Intelligence tento rok dostupná. Apple říká, že je to kvůli evropským AI regulacím.

Nové modely pravidelně posouvají možnosti toho, co za pomoci AI dokážeme. Tento měsíc jsme se dočkali nového, špičkového, modelu Claude Sonnet-3.5, který se tváří, že výrazně překonává GPT-4o, a to jak podle ohlasů komunity, výsledků v benchmarcích, tak i cenou. Zdá se, že Anthropic volí trochu jinou taktiku než OpenAI: Nové modely ohlašuje bez velké přípravy a očekávání. OpenAI na druhé straně stále nezveřejnilo GPT-4o s možnostmi využít voice nástroje, i když při ohlášení uváděli, že by to mělo trvat jen „několik týdnů“.

Anthropic také oznámil, že bychom se v nejbližší době měli dočkat i nového modelu Haiku-3.5 (levný a rychlý model) a Opus-3.5 (nejpokročilejší model). Očekávání jsou především od modelu Opus-3.5, který by mohl představovat další skok v tom, co LLM dokáže.

Novinkou jsou i Artefakty coby nová funkce přímo v Claude Assistantovi, která umožňuje vracet se k již vygenerovanému obsahu, iterovat na něm a postupně se dostat k výslednému řešení, což představuje trochu jiný přístup k práci s kódem v LLM nástrojích. Artefakty dokáží kód i spouštět, a stávají se tak velmi zajímavým nástrojem. Podle ohlasů na x.com to vypadá, že artefakty spolu s Opus-3.5 představují velmi užitečného pomocníka, který i za krátkou dobu dokáže vytvořit funkční a složité projekty.

Untitled.png

O tom, že Sonnet-3.5 představuje zajímavý pokrok, není pochyb, nemělo by se ale přehlédnout, že jsme se dočkali také prvního open-source modelu DeepSeek-Coder-V2, který v programování a v matematických úlohách překonává GPT-4. To je důležitý milník naznačují trend, že open-source komunita bude hrát v budoucnosti AI ještě velkou roli.

Kromě tohoto modelu specializovaného na programování jsme se dočkali i dalšího, více generického, modelu Qwen 2 od čínské společnosti Alibaba, který překonává modely ze série LLama3.

Text-to-video technologie nedávno zažila menší boom, když OpenAI oznámil Soru coby velmi schopný nástroj pro text-to-video generování. Podobně jako u hlasového asistenta jsme však dostali jen slabé sliby ohledně toho, kdy se nástroj dostane ke koncovým uživatelům. Tento měsíc se ale probudila i konkurence a objevilo se hned několik text-to-video nástrojů, které rozhodně stojí za zmínku. Na začátku měsíce přišli čínští vývojáři s nástrojem Kling, následovali LumaLabs s Dream Machine a následně také Runway s Gen-3. Každý z nich předvedl velmi zajímavé výsledky. A všechny přináší různé výhody a nevýhody. Co vzít na vědomí:

  • Kling je možné otestovat pouze, pokud máte čínské telefonní číslo.
  • Dream Machine od LumaLabs je dostupný, nicméně na generování videa je třeba čekat hodiny.
  • Gen-3 od Runway je prozatím dostupný pouze přes wait list.

Je zřejmé, že text-to-video technologie se rychle vyvíjí a stává se dostupnější pro širší veřejnost.

Co mohou novinky znamenat?

Trend je jasný: Využívání velkých AI modelů je stále dostupnější a stále více se přibližuje ke koncovým uživatelům. Cena za provoz klesá, zatímco schopnosti modelů narůstají: Špičkový model Opus-3.5 je nyní na čtvrtinové ceně, na které byl GPT-4 při svém prvním uvedení. Jeho schopnosti jsou přitom o úroveň lepší a rychlost výrazně vyšší. Netýká se to ale jen komerčních modelů, stejný trend vidíme i u open-source modelů, které se za poslední rok výrazně posunuly a v některých specifických úlohách dohánějí i top proprietární modely.

Pokrok se netýká pouze jazykových modelů, ale i multimodálních modelů schopných pracovat s obrazovými daty, videem nebo zvukem. I když se může zdát, že dané modely mají před sebou ještě dlouhou cestu, než začnou být skutečně užitečné a výrazně nám zasahovat do života, je důležité si uvědomit, že DALLE-2 byl uveden přibližně před dvěma lety a první verze ChatGPT ještě o kus později, což je velmi krátká doba na tak ohromný posun.

Jak může vypadat rozumná míra toho, kdy je AI správně použito jako funkce, demonstroval Apple viz výše. Je celkem pravděpodobné, že díky možnosti integrovat aplikace přímo do systému, bude povinnou výbavou aplikace i popis toho, co dokáže, tak, aby to systémové AI pochopilo, což znamená jediné: smartphone bude ještě chytřejší.

Pojďme si představit situaci, kdy řeknete budíku, aby vám ráno spustil Spotify, vybral hudbu podle aktuálního počasí a při snídani vám přečetl souhrn e-mailů, které jste během spánku obdrželi. Dosáhnout něčeho takového by se současnými technologiemi ani nemuselo být náročné.

Zajímavosti

  • Stability AI uvolnila dlouho očekávaný Stable Diffusion 3 Medium jako open-source model. Jedná se o menší, ale velmi kvalitní model dostupný komunitě. Jednou z jeho silných stránek je možnost pracovat i s textem. Více informací naleznete zde.
  • S vývojem nových modelů narůstá i potřeba je porovnávat a vyhodnocovat. Protože veřejné benchmarky se dostávají chtěně či nechtěně i do trénovacích dat, potřeba jsou lepší benchmarky, které toto řeší. Jedním z takových může být i LiveBench, který se bude pravidelně aktualizovat a bude privátní. Dalším takovým benchmarkem je arcprize, který je hodnocen jako benchmark toho, jak blízko jsme k AGI (artificial general intelligence). Dokonce nabízí půlmilionovou odměnu tomu, kdo na něm dosáhne 85 %. Na jejich stránce si můžete vyzkoušet, jak takové úlohy vypadají.
Untitled-2.png
  • Vzpomínáte si na Devina, poloautonomního softwarového inženýra? Od doby, kdy způsobil menší boom, se objevilo několik řešení, která ho podle benchmarků překonávají. Nejnověji se to podařilo modelu systému Code Droid od ⁠factory.ai. Tyto nástroje jsou ale zatím dostupné pouze na wait list nebo se zaměřují na velké enterprise společnosti.
Untitled-3.png

⁠AI News připravuje Martin Sumera. ⁠ ⁠

⁠Futured & AI. AI se do technologických řešení propisuje stále více, proto máme ve Futured dedikovaný AI tým, který se specializuje na integraci AI do nejrůznějších firemních procesů. Zpravidla se jedná o činnosti, které zabírají hodně času nebo vyžadují zapojení hodně lidí. 

Baví vás, jak o technologiích přemýšlíme? ⁠Zajímá vás, jak můžete AI využít pro svůj byznys? Napište Lukášovi Strnadlovi, který Futured založil: [email protected] & +420 605 312 459.

Chcete se k nám přidat? Aktuálně hledáme hned několik kolegů. Ozvěte se Míše Kormošové a pobavte se o možnostech spolupráce: [email protected] & +420 739 106 507.