Zdroj: Freepik
Predstavte si, že držíte v rukách text. Môže to byť esej študenta, marketingový slogan, pracovný e-mail alebo analytický komentár. Znie rozumne, je gramaticky správny, má logickú štruktúru. Otázka, ktorá dnes čoraz častejšie visí vo vzduchu, však neznie či je dobrý, ale kto ho vlastne napísal.
Ľudia, školy, médiá aj firmy sa snažia zorientovať v realite, kde texty môže vytvárať človek aj umelá inteligencia. Objavujú sa pravidlá, zákazy, etické kódexy a zároveň tlak na to, aby bolo možné spätne overiť pôvod obsahu. Práve tu však narážame na zásadný problém. Aj samotná umelá inteligencia má vážne ťažkosti rozpoznať, či text vznikol v hlave človeka alebo v algoritme.
Detekcia AI textov sa na papieri javí ako riešiteľná úloha. V praxi sa však ukazuje, že ide o jeden z najzložitejších problémov modernej digitálnej kultúry.
Problém detekcie AI textu
Základná predstava o tom, ako by mala detekcia fungovať, je pomerne jednoduchá. Vezmeme text, analyzujeme ho a na základe určitých znakov rozhodneme, či je pravdepodobnejšie, že ho napísal človek alebo stroj. Takýto verdikt potom môže slúžiť ako podklad pre ďalšie rozhodnutia, napríklad v školstve, v redakciách alebo pri kontrole dodržiavania interných pravidiel.
Lenže za touto jednoduchou schémou sa skrýva obrovská komplexnosť. Jazyk nie je matematický objekt. Nemá pevné pravidlá, ktoré by platili vždy a pre všetkých. To, čo vyzerá ako „strojový štýl“, môže byť pokojne výsledkom únavy, žánru alebo osobného prejavu autora.
Zásadná otázka navyše znie, máme vôbec k dispozícii referenčný bod? Ak jazykové modely vznikli tréningom na obrovskom množstve ľudských textov, potom ich výstupy prirodzene napodobňujú ľudský jazyk. Detektor tak nehľadá cudzie teleso, ale niečo, čo sa pohybuje priamo v jadre toho istého systému.
Neistota a neustále spochybňovanie pôvodu práce zvyšuje psychický tlak, ktorý sa neprejavuje len pocitovo, ale aj biologicky – mechanizmy stresu a jeho tlmenia opisujeme v článku Stres, blízkosť a hormóny: Prečo nás prítomnosť druhých chráni, aj keď to nevidno v krvi.
Ako fungujú nástroje na detekciu AI textov
Existuje niekoľko hlavných prístupov, ktorými sa vývojári snažia problém uchopiť. Prvým z nich je tzv. „learned detector“, teda model, ktorý sa učí rozlišovať medzi textami vytvorenými ľuďmi a textami vytvorenými umelou inteligenciou. Porovnáva nové vstupy s obrovským množstvom príkladov, ktoré už videl, a hľadá štatistické podobnosti.
Takýto prístup môže fungovať pomerne dobre, najmä ak má detektor k dispozícii pestré a aktuálne dáta. Problém však nastáva v momente, keď sa samotné AI modely zlepšujú. Detektor vždy reaguje na minulosť, zatiaľ čo generátory textu sa posúvajú dopredu.
Ďalším prístupom sú štatistické testy založené na pojmoch ako „perplexita“ či variabilita viet. Jednoducho povedané, sleduje sa, ako predvídateľný text je a ako veľmi kolíše jeho štýl. Lenže ani tu neexistuje ostrá hranica. Niektorí ľudia píšu veľmi uhladene, iní chaoticky. Akademický text sa správa inak než osobná esej.
Čítajte viac: Temná strana slávy: keď potlesk bolí viac než ticho
Limity detekčných nástrojov
Každá z týchto metód naráža na vlastné obmedzenia. Modely učené na rozlišovanie AI textov starnú extrémne rýchlo. To, čo dokázali identifikovať pred rokom, dnes už môže vyzerať úplne inak. Štatistické testy zas zlyhávajú pri kratších textoch, kde je vzorka príliš malá na spoľahlivý záver.
Osobitnou kapitolou je tzv. watermarking, teda zámerné vkladanie skrytých znakov do textu priamo pri jeho generovaní. Takýto prístup by umožnil jednoduchú verifikáciu pôvodu. Má však zásadnú nevýhodu, funguje len vtedy, ak ho AI systém použije dobrovoľne a ak text neprejde ďalšími úpravami.
Vo výsledku sa ukazuje, že detekcia AI textov je súčasťou neustáleho technologického preteku. Generátory sa zlepšujú, detektory ich dobiehajú, no nikdy nezískajú trvalú výhodu. Jazyk je príliš flexibilný a adaptívny.
Čítajte viac: Keď sa sláva rozpadne zvnútra. Príbehy kapiel, ktoré nezničil nedostatok talentu, ale psychická cena úspechu
Tvrdá realita
Problém detekcie AI textov sa dá opísať jednou vetou, je jednoduché ho pomenovať, no mimoriadne ťažké vyriešiť. Nejde o dočasnú technickú prekážku, ktorú odstráni lepší algoritmus alebo výkonnejší počítač. Ide o systémový problém vyplývajúci zo samotnej podstaty jazyka.
Ak je cieľom umelej inteligencie písať ako človek, potom text, ktorý sa nedá odlíšiť od ľudského, nie je chybou, ale úspechom. A práve tento úspech robí spoľahlivú detekciu prakticky nemožnou.
Pre inštitúcie to znamená nepríjemnú zmenu paradigmy. Spoliehať sa výlučne na detektory pri presadzovaní pravidiel je riskantné. Falošne pozitívne výsledky môžu poškodiť dôveryhodnosť, reputáciu aj vzťahy.
Slepa dôvera v technické nástroje pripomína situácie, keď sa systém prestane pýtať, či má pravdu, presne tento mechanizmus rozoberáme aj v texte Keď ideológia oslepí rozum.
Čo to znamená pre spoločnosť
Ako sa spoločnosť prispôsobuje generatívnej umelej inteligencii, mení sa aj pohľad na autorstvo, originalitu a zodpovednosť. Namiesto honby za dokonalou detekciou sa čoraz viac hovorí o transparentnosti, jasných pravidlách použitia a o tom, ako bol text vytvorený a použitý, nie len kým.
Možno sa budeme musieť naučiť žiť s tým, že niektoré otázky zostanú nezodpovedané. Že text nebude mať jednoznačný pôvod. A že hranica medzi človekom a strojom v jazyku sa definitívne rozplynie.
Nie preto, že by technológia zlyhala. Ale preto, že jazyk bol vždy spoločným priestorom a umelá inteligencia sa doň jednoducho naučila vstúpiť.
Nejde pritom len o texty, podobná otázka transparentnosti a kontroly nad výstupmi umelej inteligencie sa objavila aj v prípade, keď sa ukázalo, ako systémy pracujú s dátami po smrti používateľov, čo podrobne mapuje článok Prípad vraždy a samovraždy ukazuje, že OpenAI selektívne skrýva dáta po smrti používateľov.