Zdroj: Freepik.com
Umelá inteligencia (AI) je vzrušujúce a rýchlo sa rozvíjajúce odvetvie informatiky, ktoré sa zaoberá technológiami napodobňujúcimi ľudskú inteligenciu. Systémy AI sa stali v posledných rokoch bežnou súčasťou nášho života.
AI predstavuje akúkoľvek technológiu, ktorá prejavuje aspekty ľudskej inteligencie. Patrí sem rozpoznávanie objektov na obrázkoch, vytváranie viet, predpovedanie pohybu akcií a mnohé ďalšie úlohy.
Vedci sa snažia vytvoriť AI už od počiatkov počítačovej éry, od obdobia dawn of the computing era. Dlhý čas dominoval prístup založený na rozsiahlych databázach faktov a pravidiel. Počítačové programy následne uplatňovali logiku na rozhodovanie. V poslednom desaťročí však nastal zásadný obrat v podobe nových metód, pri ktorých sa stroje učia z dát samostatne. To prinieslo revolučný pokrok v celom odbore.
Za uplynulé roky stroje ukázali až „nadľudské“ schopnosti. Dokážu napríklad odhaliť rakovinu prsníka z medicínskych snímok, excelujú v hrách šach a go a dokonca dosiahli prelom aj v predpovedaní štruktúry proteínov
Po uvedení chatbota ChatGPT koncom roku 2022 začal narastať konsenzus, že by sme mohli byť na prahu vytvorenia tzv. AGI – artificial general intelligence, ktorá by bola podobná ľudskej inteligencii. „Ide o obrovskú zmenu v oblasti AI,“ uviedla Sara Hooker, vedúca laboratória Cohere For AI, ktoré založila spoločnosť Cohere.
Ako AI funguje?
Dnes je najrozšírenejším prístupom k budovaniu AI systémov strojové učenie. To spočíva v tom, že počítač analyzuje obrovské množstvá dát, hľadá v nich vzory a učí sa z nich predpovedať nové výsledky.
Proces riadi algorithm – séria inštrukcií, ktoré hovoria počítaču, ako pristupovať k dátam. Výsledkom je štatistický model, ktorý zakóduje všetky nové vzory a následne na ich základe generuje predpovede.
Medzi najrozšírenejšie systémy dnes patria neural networks, teda neurónové siete inšpirované human brain. Tieto siete sa učia postupným upravovaním väzieb medzi umelými neurónmi na základe tréningových dát a používajú sa v textových, obrazových, hudobných aj video generátoroch.
Najpokročilejším smerom je dnes hlboké učenie (deep learning) – veľké neurónové siete s mnohými vrstvami. Koncept existuje od 80. rokov, no až v roku 2012 vedci zistili, že tréning výrazne zrýchľujú grafické procesory GPUs. Odvtedy sa stal deep learning štandardom.
„Hlboké neurónové siete sú ako strojové učenie na steroidoch,“ hovorí Hooker. „Sú extrémne výpočtovo náročné, no rovnako výkonné.“
Rôzne architektúry neurónových sietí sa hodia na rôzne úlohy:
- Convolutional neural networks — inšpirované vizuálnou kôrou živočíchov, vhodné na obrazové úlohy.
- Recurrent neural networks — so zabudovanou pamäťou na spracovanie sekvenčných dát.
Spôsoby tréningu sa líšia podľa potreby:
- Supervised learning — ľudia označujú dáta (napr. „cat“).
- Unsupervised learning — neoznačené dáta, kde model hľadá vzory samostatne. Ide o základ mnohých moderných LLM.
- Reinforcement learning — učenie pokusom a omylom, využívané pri robotoch a hrách. Využívajú ho humanoidné roboty ako Figure 01 či soccer-playing miniature robots. Tento prístup stál aj za vznikom prelomového modelu AlphaGo od Google DeepMind.
Čo je generatívna AI?
Generatívna AI využíva hlboké učenie a neurónové siete na tvorbu obsahu podľa požiadavky používateľa, textu, obrázkov, zvuku či videa.
Textové generátory ako ChatGPT sú časťou oblasti nazývanej NLP – natural language processing. Zlom nastal v roku 2017, keď vedci z Google predstavili nový typ neurónovej siete transformer.
Transformery sú špičkové v spracovaní masívnych textových databáz. Dokážu sledovať vzťahy medzi slovami aj v dlhých textoch, čo im dáva schopnosť porozumieť kontextu.
Transformery stoja aj za ďalšími prelomovými modelmi, napríklad Stable Diffusion a DALL-E, ktoré generujú obrázky z textových opisov, či AlphaFold 2, ktorý predpovedá štruktúry proteínov.
Úzka AI vs. AGI – aký je rozdiel?
Tradičné modely sú tzv. narrow AI, dokážu vykonávať jednu úlohu, ako preklad textu alebo rozpoznávanie tvárí. V tom, na čo sú trénované, často prekonávajú ľudí.
LLM ako ChatGPT sú však iné, dokážu odpovedať na otázky, sumarizovať texty, prekladať, písať kód a riešiť množstvo rôznych úloh naraz. To viedlo viacerých odborníkov aj v rámci DeepMind k úvahe, či ide o krok k AGI.
AGI je hypotetická všeobecná inteligencia, ktorá dokáže zvládnuť akúkoľvek kognitívnu úlohu tak ako človek, adaptovať sa na nové situácie a riešiť abstraktné problémy.
Napriek entuziazmu existujú obavy, že AGI môže viesť k veľkým ekonomickým a spoločenským rizikám, od narušenia trhu práce až po potenciálne zneužitie AI na tvorbu nových patogénov či zbraní.
Skeptici tvrdia, že LLM sú ďaleko od AGI, vraj len kombinujú naučené vzory bez skutočného porozumenia. Podľa nich sú limitované tréningovými dátami a fungujú ako iná úzka AI.
Sara Hooker upozorňuje, že dnešný trend smeruje k tzv. foundation models, teda základným modelom, na ktorých sa následne stavajú ďalšie aplikácie. „Ľudia prechádzajú od špecializovaných modelov k systémom, ktoré dokážu všetko,“ hovorí.
Ako sa AI používa v reálnom svete?
Strojové učenie je dnes všade okolo nás:
- odporúčacie algoritmy na Netflix a YouTube,
- modely pre automatický preklad,
- bankové systémy monitorujúce podvody,
- počítačové videnie v kamerách a autonómnych autách.
Generatívna AI už dávno nie je len chatbot. Veľké technologické firmy ponúkajú chatboty schopné analyzovať dokumenty, sumarizovať texty, prekladať alebo radiť programátorom, napríklad Github Copilot. Vyhľadávače integrujú LLM, napríklad model Gemini v Google Search.
Hoci sú LLM veľmi presvedčivé, stále majú chyby. Robia štatistické odhady a niekedy vytvárajú hallucinations, presvedčivé, no nesprávne odpovede.
Sara Hooker upozorňuje, že generatívna AI je ešte veľmi mladá, „Je nezvyčajné, aby technológia bola na hranici možností a zároveň tak masovo nasadená. To prináša riziká aj výzvy.“