Napomáhám poznání, vzdělávání a implementaci umělé inteligence. A také vytvářím webové stránky a aplikace.
Milan Pokorný
14. 6. 2024, ve spolupráci s ProfitBuilders
"Člověk už není jediným zdrojem inteligence?" Tato věta dobře vystihuje to, co se stalo v roce 2023. Při prvním setkání s touto větou mnoho lidí z různých "kancelářských" a kreativních oborů zachvátila hrůza a zároveň ohromení. Časem ale mnozí začali vidět výhody a přínosy, které nový druh inteligence přináší. Zároveň se ale objevili tací, kterým se nepovedl najít jiný úhel pohledu a zůstali ve stavu strachu. Tyto osoby bychom v rámci technologické ideologie mohli nazvat doomeristy. Na druhou stranu, nadšencům, kteří umělou inteligenci přehánějí, říkáme “AI Bros”. Jak jsme se sem dostali? Jak je možné, že během jednoho roku se z technologie, kterou mnozí považovali za "nové krypto", stala možná nevyhnutelná budoucnost lidstva? Co předcházelo roku 2023, jak tento rok probíhal a co nás čeká?
Po druhé světové válce, kdy se Alan Turing podílel na projektu Enigma a významně přispěl k rozluštění šifer tohoto projektu, byl Turing považován za průkopníka v oblasti počítačové vědy. Mezi jeho mnoha výzkumy se zaměříme na jeden konkrétní a tím je jeho invence “Turingova testu”. Turingův test byl navržen jako jednoduchý způsob, jak posoudit, zda stroj vykazuje inteligentní chování srovnatelné s chováním člověka. Pokud stroj dokáže v konverzaci přesvědčit dostatečný počet lidí, že je člověkem, měl by být považován za "inteligentní". Tento test navrhl v roce 1950 a položil tím základy pro rozvoj debaty a konceptů v oblasti umělé inteligence. Termín “umělá inteligence” jako takový, byl oficiálně poprvé použit až v roce 1956 během konference v Dartmouthu. Tato konference je často citována jako zrození oboru umělé inteligence jako samostatného vědního oboru. I když se Alan Turing této konference neúčastnil, tak právě kvůli svému výzkumu Turingova testu je považován za otce umělé inteligence.
Zejména na začátku roku 2023 bylo slyšet ze sociálních sítí, že umělá inteligence je “novým kryptem”. Technologie, která má potenciál na to změnit lidstvo, ale moc mladá na to, aby to dokázala. A tady je ten kámen úrazu. Umělá inteligence není mladým oborem. Výzkum umělé inteligence probíhá minimálně od 50 let minulého století a to, co vidíme dnes je jedním z mnoha výsledků a průlomů při výzkumu této technologie. Na časové ose 20. století by jsme mohli vytyčit mnoho bodů, kdy došlo k průlomům v oboru umělé inteligence. Mezi ně patří například první chatbot ELIZA schopný vést jednoduchou konverzaci nebo Deep Blue od IBM schopen porazit ruského šachového velmistra Garryho Kasparova v šachové partii.
Největší průlomy v technologii AI přišli ale na počátku 21. století a to primárně kvůli zavedení algoritmů “hlubokého učení” (deep learning). O této technologii jste jistě již slyšeli. Jedná se o technologii, která pohání většinu komplexnějších systémů, které používáme na denní bázi. Ať už se jedná o Google vyhledávač, který využívá umělou inteligenci pro zlepšování porozumnění toho, co mu zadáte aby vyhledal, nebo Apple Siri, která díky deep learning dokázala porozumět tomu, co uživatel říká. Umělá inteligence je tu s námi posledních téměř 20 let, akorát ji nikdo z nás nevnímal tak aktivně jako dnes. Byla schovaná na pozadí těch největších systémů a “backend” algoritmů aplikací, protože pouze tam ji bylo možné efektivně využít.
Diskutabilně ale jeden z největších přelomů přišel v roce 2015 kdy AlphaGo od DeepMind dokázal porazit evropského šampiona ve hře Go, jednu z nejtěžších a nejkomplexnějších strategických her na světě. Následně o pouhý rok později porazil AlphaGo světového šampiona v této hře Lee Sedola a to v drtivé porážce 4:1. V reakcích po zápasech Lee Sedol hovořil o tom, že tato událost byla pro něj velkou lekcí a přiměla ho přehodnotit mnoho svých představ o hře Go. Hovořil také o tom, že AlphaGo má neomezený potenciál a že celá zkušenost byla pro něj velmi cenná.
Porážka od AlphaGo také vedla k širší diskuzi o budoucnosti umělé inteligence a jejím vlivu na společnost a lidské schopnosti. Lee Sedol se stal součástí této diskuse, protože jeho zápasy s AlphaGo byly významným mezníkem v historii umělé inteligence, ukazujícím, že AI může dosáhnout a překonat lidské schopnosti v náročných intelektuálních úkolech.
Následná lavina objevů a průlomů vedla k vytvoření “transformer” modelů od Google (tvůrce AlphaGo), které následně vedli k vytvoření jednoho z prvních LLM modelů zpracovávající přirozený jazyk na architektuře transformerů - GPT. Průlomy v následujících letech vedli k vytvoření GPT-2 v roce 2018, GPT-3 v roce 2020, GPT-3.5 v roce 2022 a následně GPT-4 v roce 2023, který dal život aktuálně nejvýkonnějšímu modelu GPT-4o (omni).
Zejména díky GPT-3.5 a GPT-4 se umělá inteligence dostala do povědomí světa. Ze stínů backendových systémů k porozumění jazyka do rukou lidí v podobě chatbotů, jako je třeba ChatGPT.
Bylo by ale také fér zmínit i ostatní modely, které se společně s GPT od OpenAI objevili. Ať už se ať už se jedná o firmu Anthropic s modely Claude a Claude 2, Google s modelem Geminy, Metu s LLaMa, Evropský Mistral AI, Falcon LLM a mnoho dalších.
Velice troufalý titulek že? I tak by se ale dal popsat pokrok v technologiích “diffusion modelů”. Prozatím jsme zmínili pouze jazykové modely poslední doby, co ale ona tvorba obrázků a videí, které jsme zaznamenali všichni v poslední době? Midjourney, Dall-E, Stable Diffusion. To jsou jména, které jste jistě mohli již někde slyšet. Jedná se o modely, které pomocí difúze dokáží tvořit. Ať už jde o obrázky, video, animace. Asi nejlepším indikátorem toho jak moc se difúzní modely posunuli během roku 2022 a 2023 bude ukázka jejich práce.
Difuzní modely se během pouhých dvou let dokázali posunout od až skoro abstraktních vyjádření objektů k fotorealistické přesnosti, kdy už ani trénované oko nedokáže rozeznat rozdíl mezi obrazem nebo fotkou vygenerované AI od lidsky vytvořeným dílem.
Pokročilost této technologie umožnila vzestup technologie pro tvorbu videa. Prozatím je tvorba videa v plenkách, ale i tak již dnes dokážou modely imitovat lidskou postavu a tvořit tím důvěryhodně “deep fakes” s kterými jsme se již mohli setkat jak v televizi tak na sociálních sítích. Tato technologie se posouvá takovým tempem, že již dnes máme modely, které dokážou generovat celé filmové snímky, nebo krátká videa (OpenAI Sora, LumaLabs)
Kombinací jazykových modelů (LLM) a modelů založených na difuzi, začíná proces, který mnoho lidí nazývá demokratizace tvorby, kdy je jeden člověk schopen například napsat knihu a vytvořit k ní ilustrace bez jakýchkoliv předchozích zkušeností s tvorbou obsahu, ať už čteného nebo vizuálního.
Vypadá to, že v poslední době za každým novým “revolučním” objevem stojí kombinace práce člověka a umělé inteligence. Například takový AlphaFold od DeepMind (Google), který dokáže předpovědět strukturu bílkovin. Co to znamená ptáte se? Dopad toho, co znamená možnost předpovídání struktury bílkovin by si zasloužil článek sám o sobě. Můžeme ale už teď říct, že pokroky v biologii díky umělé inteligenci vedou k novému oboru, který v zahraničí nazývají Výpočetní biologie (volný překlad z Computational Biology, odkaz na podcast). O výpočetní biologii, si mnozí myslí, že povede k rychlejšímu tvoření vakcín, obecných léků “na všechno” a časem i k lidské nesmrtelnosti. Nesmrtelnost? (buněčná regenerace) Opravdu? To nemůžete myslet vážně.
Prozatím neexistuje praktické doložení toho, že by něco takového bylo možné, ale díky postupům ve vývoji umělé inteligence, se začínají tvořit teoretické modely toho, jak dosáhnout regenerace buněk díky předpovědi struktury proteinů, které AlphaFold momentálně dosahuje s 92.4% přesností. To nepřímo vede až k “vynálezu” nesmrtelnosti.
Po takové bombě trochu zpomalíme. Nebo jak pro koho. Ukážeme si teď co dokázal další model od DeepMind (GNoME) a tím je předpovídání struktur a složení materiálů. Do dnů umělé inteligence jsme jako lidstvo objevili něco na 20 000 různých materiálů. Díky těmto materiálům máme možnost vyrábět elektroniku, materiály pro stavbu, solární modely a mnohem více. Do dnešního dne jsme tyto materiály objevovali skrze metodu “pokus omyl”. A tady opět nastupuje na scénu umělá inteligence. Model od DeepMind dokázal objevit a předpovědět dalších více než 2.2 milionu nových materiálů (odkaz na článek). U mnoha z těchto nových materiálů už teď víme, že nás jako lidstvo posunou v již existujících technologiích pouze tím, že nahradíme materiály, které používáme dnes za nové.
A je mnoho a mnoho dalších objevů, tohle je pouze “špička ledovce”.
Zatím článek sloužil jako takové “historické okénko” do světa umělé inteligence, ať už té nedávné nebo vzdálené. Hlavním účelem bylo ukázat, že technologie umělé inteligence je mnohem pokročilejší, než jsou lidé kolikrát ochotni přiznat. Je za ní minimálně 70 let výzkumů a v posledních 15-ti letech i nespočet průlomů, které vypadají, že začínají tvořit efekt “sněhové koule”. Každý další průlom napomáhá k urychlení dosažení toho dalšího.
Jaké efekty jsou ale vidět už dnes? Jak nás ovlivňuje umělá inteligence na denní bázi a jaké efekty na nás má?
Umělou inteligenci můžeme vidět už dnes všude kolem sebe. Postupně začíná být implementovaná do operačních systémů (např. Windows Copilot), produktů, které využíváme každý den v práci (např. Office 365, Notion), na sociálních sítích jako moderátor nebo ve vyhledávačích jako třeba Google Bard poháněný Geminy nebo Bing Copilot poháněný GPT-4. Také můžeme vidět velké množství obsahu tvořeného na informační a novinkové servery pomocí umělé inteligence. Některé servery jsou již dnes plně automatizované a veškerý obsah na nich je tvořený umělou inteligencí. ('glorbo incident') To samé začíná platit pro video obsah, kdy například na síti Youtube existují kanály, jejichž obsah je plně tvořený skrze AI (video, zvuk, scénář). Vytváření podkladů pro marketingové agentury se stává jednodušší a jednodušší. To samé platí pro firmy, kdy se “intelektuální práce” stáva efektivnější a rychlejší díky umělé inteligenci. Například o firmě Google se spekuluje, že projde restrukturalizací zapříčiněnou postupem v technologiích AI. Google by tak měl dát výpověď až 30 000 zaměstnanců. (Klarna AI nahradila práci 700 asistentů)
Dostáváme se tak do strašidelného teritoria, kdy již nyní firmy začínají nahrazovat zaměstnance umělou inteligencí. A nebavíme se zde jen o pracech jako je zákaznická podpora nebo tvorba jednoduchých textů pro web. Například ze sféry oboru programování, začíná být zřejmé, že velké firmy uzavírají pozice pro juniorní programátory. Je dost pravděpodobné, že již za pár let, nebude profese “kódování” potřeba, protože ji zvládne umělá inteligence. Již dnes seniorní programátoři fungují díky nástrojům jako GitHub Copilot v režimu extrémní produktivity. A práce, které byli dříve titěrné a předávali se juniorním pozicím, již zastane umělá inteligence. A toto začíná být pravdivé nejen pro sektor programování. (poznámka: tímto odstavcem není myšleno, že pouze AI může za uzavírání juniorních pozic, ale aktuálně je to jedna z hlavních příčin)
Umělá inteligence začíná zasahovat i do lidských vztahů a mentálního zdraví. Příkladem může být například aplikace replika.ai. Aplikace funguje jako váš parťák, s kterým si můžete povídat a třeba se i zasmát. Na otáčkách ale aplikace nabírá ve chvíli, kdy uživatel zjistí, že je replika ochotná být i vaším partnerem. Můžete s ní vést intimní konverzace, nebo si vyžádat fotky, které určitě nejsou vhodné pro zveřejňování. Můžeme začít pozorovat, že jsou tací, kteří se zamilovali do umělé inteligence (odkaz na článek). V roce 2023 došlo dokonce ke kauze "lobotomizace" této aplikace, kdy uživatelé vyjádřili nespokojenost s tím, že společnost způsobila otupění jejich virtuální přítelkyně.
Stejným tempem jako se ukazují aplikace virtuálních partnerů, můžeme vidět aplikace, které se snaží zaměřit na téma mentálního zdraví s cílem udělat psychickou pomoc více dostupnou, pro každého.
Všechno o čem jsme si zatím řekli jsou z většiny pozitivní věci, které technologie umělé inteligence přinesla. Je ale na čase zmínit i negativa.
Jedním z prvních a již zmíněných negativ je nahrazování lidí ve firmách umělou inteligencí. Prozatím můžeme pozorovat velké negativní zásahy do životů například grafiků nebo například copywriterů. Na internetu lze dohledat mnohá svědectví o tom, kdy agentura plně nahradila třeba i celý tým copywriterů, protože nyní jejich práci zvládne jeden nebo dva lidi s pomocí umělé inteligence. Nebo příběhy překladatelů a aplikací pro učení jazyků, kdy “výbuch” technologie AI způsobil výrazně nižší zájem o jejich služby. Příkladů jim podobných je nespočetně mnoho. Prozatím dochází k postupnému zásahu do vybraných intelektuálních “kancelářských” prací. Tyto profese nyní zažívají dobu, kterou si zažili v minulém století například farmáři při vynálezu traktoru. Farmaření nezaniklo, bylo pouze přeměněno tak, že nebylo potřeba tolik farmářů. Bude ale tohle pravda i v případě umělé inteligence? Co se stane ve chvíli, kdy umělá inteligence nahradí všechnu intelektuální práci? Ano vytvoří se nové pracovní pozice, ale… Co když umělá inteligence nahradí i ty?
Dalším aktuálním problémem v řešení je rozpor s tím, co znamená autorské právo ve světě umělé inteligence. Je důležité zmínit, že umělá inteligence “nekopíruje” text nebo obrázky z jejich originálů. Aktuální modely pracují se statistickým model předpovídání dalšího znaku v případě jazykových modelů nebo pixelu v případě difuzních modelů. Model se naučil a zkonzumoval enormní množství informací, a díky nim, dokáže imitovat věci nové. Ve chvíli, kdy nad modely uvažujeme tímto způsobem, můžeme argumentovat, že podobně funguje i lidské učení a tvorba. Před tím, než jste schopni něco tvořit nebo něčemu rozumnět, musíte konzumovat velké množství znalostí. Ať až se jedná o znalosti z knih, videí, muziky nebo jiných zdrojů. U mnoha spisovatelů, malířů nebo tvůrců jakéhokoliv obsahu, by jsme mohli tvrdit, že jejich práce byla jistým způsobem ovlivněna nebo inspirována tím, jaké informace konzumovali. Umělá inteligence funguje na podobném principu.
Ve chvíli, kdy uznáme myšlenku toho, že se umělá inteligence učí a její výstupy jsou pouze nejpravděpodobnějším výstupem ovlivněným vstupními daty… Znamená to, že budeme rozlišovat autorské právo ve vytvořeném díle člověkem a umělou inteligencí? A jak toho dosáhneme? Možná je čas začít diskuzi o přeformulování autorského práva a jak ho chápeme.
Další negativa jako je například manipulace populací pomocí deep fakes a automatizovaných “botů” pomocí umělé inteligence a mnoho dalších, by si zasloužila článek sám o sobě (opět), a tak je snad vhodný čas na to se zeptat. Jak umělá inteligence změní svět? Jak změní nás?
Pokračování příště...
Zajímá vás svět umělé inteligence? Potřebujete poradit s její implementací do osobních nebo firemních procesů? Nebo máte zájem o spolupráci? Neváhejte mě kontaktovat.