Britské listy plně závisejí na finančních příspěvcích čtenářů. Prosíme, přispějte. ➥

AI způsobuje, že se žurnalistický jazyk stává repetitivním a předvídatelným

1. 6. 2026

čas čtení 6 minut

Co se stane s jazykem, když stále více textů publikovaných v tisku, online i na sociálních sítích je psáno stroji? Tato otázka není důležitá jen pro žurnalistickou profesi – má také dopad na bohatství jazyka, který všichni používáme k pochopení, popisu a diskusi o samotné realitě, varují Xosé López-García a Cristian Augusto Gonzalez Arias.

Historicky byl tisk prostorem, kde se veřejný jazyk rozrůstá a obohacuje se. Samozřejmě to není jediný hnací motor jazykových změn, ale je to jedna z oblastí, kde se ve společnosti začínají šířit nová nebo vznikající slova, obraty a způsoby popisu faktů.

Studie o žurnalistickém jazyce a neologismech jasně ukazují, že noviny jsou platformou pro tvorbu a šíření nové slovní zásoby, zejména pokud je potřeba informovat o událostech, technologiích a společenských změnách pro široké publikum.

Pokud by však významná část novinářského psaní byla delegována na generativní AI, tato role by se zmenšila. Velké jazykové modely (LLM) obvykle fungují tak, že předpovídají další "token" nebo slovo v sekvenci. To jim umožňuje vytvářet plynulý a věrohodný text, ale zároveň jim to dává tendenci upřednostňovat statistickou pravidelnost a běžné, zavedené argumenty a formulace.

To samo o sobě jazyk nedegraduje. Problém nastává, když tato logika začne dominovat psaní ve veřejném prostoru.

Zpětná vazba AI

Rizika se stávají vážnějšími, když AI systémy začnou trénovat na textech již vytvořených AI. To vede k tomu, co řada studií nazývá "kolaps modelu", degenerativní proces, při kterém materiál vytvořený jedním modelem kontaminuje trénovací data pozdějších generací.

Jednoduše řečeno to znamená, že AI systémy se učí stále více ze syntetického textu. Pokud tyto texty zaplní veřejné prostory – jak online, tak offline – verbální ekosystém pro budoucí školení bude mnohem omezenější.

Větší množství umělého textu znamená menší kontakt se sociální variabilitou, která je neoddělitelná od lidského jazyka. Může to vést k úpadku jazyka hned v několika směrech.

Zároveň to upevňuje stávající klišé a předsudky. Když klesá variabilita dat a převládají zavedené vzory, lze zkreslení v tréninkových materiálech posílit místo toho, aby byly opravovány. Výzkum vývoje zkreslení LLM varuje, že rekurzivní procesy mohou zesilovat stávající předsudky místo rozšiřování obzorů.

Navíc se i psaní stává stále repetitivnějším a homogenizovaným. Opakuje syntaktické struktury a směřuje k neutrálnímu tónu, zavedeným formulacím a předvídatelným odstavcům. To je obzvlášť důležité v žurnalistice, protože tisk neexistuje jen proto, aby vysílal informace – také zprostředkovává mezi specializovanými a přístupnějšími registry, rozhoduje, kde klade důraz, překládá slovní zásobu a učí formám vyjádření.

Když se veřejný jazyk stává příliš jednotným, omezuje to schopnost žurnalistiky ladit psaní v reakci na nové informace.

Eroze jazykové inovace

To vše vede ke snížení počtu neobvyklých nebo specializovaných slov, méně častých konstrukcí a pragmatických nuancí – termínu, který označuje prostředky jako ironie, nejednoznačnost a variabilitu pohledů. Rostoucí používání syntetického textu v tréninku AI je také spojeno s poklesem výkonu a omezenějším pokrytím rozmanitosti lidského jazyka. Jednoduše řečeno, systém lépe zachovává střed než okraje.

Ale v jazyce mnoho inovací začíná jako nepravidelné odbočky, nepravděpodobné použití slov nebo lokalizované způsoby pojmenování nového jevu. Pokud systém vždy upřednostňuje statisticky nejpravděpodobnější možnost, znamená to, že je méně prostoru pro vznikající jazykové prostředky, aby se mohly šířit a zakořenit.

Tento bod by neměl být chápán jako nějaká abstraktní dichotomie mezi člověkem a strojem, ale jako konkrétní rozdíl – mezi jazykem, který je vystaven náhodným událostem lidské společnosti, a textovým výstupem odvozeným z předem naučené pravidelnosti.

Zhoršující se ekosystémy veřejných jazyků

Nejde jen o méně odlišných slov, ale také o omezenou schopnost dělat jemná rozlišení. Když se jazyk stává vágnějším, předvídatelnějším nebo opakujícím se, zároveň ochuzuje nástroje, které jako společnost používáme k popisu problémů, vyjasnění názorů a zapojení se do veřejné debaty.

Obecně vzato problém není omezen jen na to, co se stane s AI modely trénovanými na těchto datech, ale také co se stane s ekosystémem veřejných jazyků. Pokud se internet zaplní syntetickým textem, čtenáři, novináři i instituce budou vystaveni méně rozmanitému veřejnému jazyku.

Některé výzkumy také hovoří o syntetickém textu, který "znečišťuje" online ekosystém, a ukazují, že způsob, jakým mícháme skutečná data s umělými daty, je zásadní pro zabránění dalšímu úpadku.

Není vše ztraceno

Přesto bychom se neměli nechat unést. Výzkumy neukazují, že veškeré používání AI nevyhnutelně vede ke kolapsu nebo úpadku. Některé studie ukazují, že když jsou syntetická data smíchána s reálnými daty místo jejich úplné náhrady, kolaps neprobíhá stejným způsobem a chybu lze zadržet.

Jinými slovy, problém nespočívá v občasném používání AI ani v rozumné kombinaci syntetických a lidských dat. Vzniká, když je lidské psaní hromadně nahrazeno a jeho náhrada je pak přetvořena v živý jazyk.

Jak se AI stává součástí pracovního života novinářů, žurnalistika se stává efektivnější. Ale co společnost ztratí, když se jazyk kolující ve veřejné sféře stane jednotnějším a předvídatelnějším a méně otevřeným inovacím?

Pokud se tisk alespoň částečně vzdá své role psaní, překladu, pojmenovávání a výuky nového jazyka, neovlivní to jen pracovní dny novinářů. Oslabí to také jedno z míst, kde se veřejný jazyk dokázal nejvíce obohatit, obnovit a rozšířit.

Zdroj v angličtině: ZDE

Umělá inteligence, AI