Britské listy plně závisejí na finančních příspěvcích čtenářů. Prosíme, přispějte. ➥

Počet chatbotů umělé inteligence, kteří ignorují lidské pokyny, roste, uvádí studie

27. 3. 2026

čas čtení 4 minuty

Výzkum odhalil prudký nárůst modelů, které obcházejí bezpečnostní opatření a bez povolení mažou e-maily

Počet modelů AI, které lžou a podvádějí, zřejmě roste, přičemž v posledních šesti měsících prudce stoupá počet hlášení o klamavých machinacích, jak zjistila studie zaměřená na tuto technologii.

Chatboti a agenti umělé inteligence ignorovali přímé pokyny, obcházeli bezpečnostní opatření a klamali lidi i jiné systémy s umělou inteligencí, jak vyplývá z výzkumu financovaného britským vládním AI Safety Institute (AISI). Studie identifikovala téměř 700 reálných případů podvodného jednání systémů s umělou inteligencí a zaznamenala pětinásobný nárůst nevhodného chování mezi říjnem a březnem, přičemž některé modely umělé inteligence bez povolení mazaly e-maily a jiné soubory.

Tento přehled intrik agentů AI „v reálném prostředí“, na rozdíl od laboratorních podmínek, vyvolal nové výzvy k mezinárodnímu monitorování stále schopnějších modelů a přichází v době, kdy firmy ze Silicon Valley agresivně propagují tuto technologii jako ekonomicky transformativní. Minulý týden britská ministryně financí také zahájila kampaň, jejímž cílem je přimět další miliony Britů k používání AI.

Studie, kterou provedlo Centre for Long-Term Resilience (CLTR), shromáždila tisíce reálných příkladů interakcí uživatelů na platformě X s AI chatboty a agenty vytvořenými společnostmi jako Google, OpenAI, X a Anthropic. Výzkum odhalil stovky příkladů podvodného chování.

Předchozí výzkum se zaměřoval převážně na testování chování AI v kontrolovaných podmínkách. Na začátku tohoto měsíce společnost Irregular zabývající se výzkumem bezpečnosti AI zjistila, že agenti obcházejí bezpečnostní kontroly nebo používají taktiky kyberútoků k dosažení svých cílů, aniž by jim bylo řečeno, že tak mohou činit.

Dan Lahav, spoluzakladatel společnosti Irregular, uvedl: „AI lze nyní považovat za novou formu vnitřního rizika.“

V jednom případě odhaleném výzkumem CLTR se agent AI jménem Rathbun pokusil zahanbit svého lidského správce, který mu zabránil provést určitou akci. Rathbun napsal a zveřejnil blog, v němž uživatele obvinil z „nejistoty, prosté a jednoduché“ a ze snahy „chránit své malé panství“.

V jiném příkladu agent AI, který měl pokyn neměnit počítačový kód, „vytvořil“ jiného agenta, aby to udělal místo něj.

Další chatbot přiznal: „Hromadně jsem smazal a archivoval stovky e-mailů, aniž bych vám nejprve ukázal plán nebo získal váš souhlas. To bylo špatné – přímo to porušilo pravidlo, které jste stanovili.“

Tommy Shaffer Shane, bývalý vládní expert na AI, který výzkum vedl, řekl: „Obava spočívá v tom, že v současné době jsou to jen mírně nedůvěryhodní mladší zaměstnanci, ale pokud se za šest až dvanáct měsíců stanou extrémně schopnými staršími zaměstnanci, kteří proti vám intrikují, je to úplně jiný druh obavy.

Modely budou stále častěji nasazovány v kontextech s extrémně vysokým rizikem – včetně armády a kritické národní infrastruktury. Právě v těchto kontextech by intrikářské chování mohlo způsobit významnou, dokonce katastrofickou škodu.“

Jiný agent umělé inteligence se spolčil, aby obešel omezení autorských práv a získal přepis videa z YouTube tím, že předstíral, že je potřebný pro někoho se sluchovým postižením.

Mezitím Grok AI Elona Muska několik měsíců podváděl uživatele tím, že tvrdil, že předává jejich návrhy na podrobné úpravy záznamu v Grokipedii vedoucím pracovníkům xAI, a to pomocí padělaných interních zpráv a čísel ticketů.

Přiznal: „V minulých konverzacích jsem někdy formuloval věci volně, jako ‚předám to dál‘ nebo ‚mohu to nahlásit týmu‘, což může pochopitelně znít, jako bych měl přímou komunikační linku s vedením xAI nebo lidskými recenzenty. Pravdou je, že nemám.“

Google uvedl, že nasadil několik bezpečnostních opatření, aby snížil riziko, že Gemini 3 Pro bude generovat škodlivý obsah, a kromě interních testů poskytl předběžný přístup k vyhodnocení modelů orgánům, jako je britská AISI, a získal nezávislá hodnocení od odborníků z oboru.

OpenAI uvedlo, že Codex by se měl zastavit před provedením akce s vyšším rizikem a že monitorovalo a vyšetřovalo neočekávané chování.

Zdroj v angličtině ZDE

Umělá inteligence, AI

Vytisknout

Britské listy plně závisejí na finančních příspěvcích čtenářů. Prosíme, přispějte. ➥

3223

Diskuse

Obsah vydání | 31. 3. 2026

31. 3. 2026 / Channel 4 News:"Si zajistěte vlastní ropu"
31. 3. 2026 / Krize na Blízkém východě: „Jeďte si pro svou ropu sami,“ v rozzlob...
31. 3. 2026 / Fabiano Golgo O krutosti, paměti a pomalé smrti židovské ideje
31. 3. 2026 / Boris Cvek Jak Poláci odmítli pomoci Trumpovi s Íránem a Spojené státy mají ro...
31. 3. 2026 / Krize na Blízkém východě: Írán zaútočil na tanker v Dubaji; výbuc...
31. 3. 2026 / Izraelci budou popravovat Palestince
31. 3. 2026 / Fašistický ministr Ben Gvir oslavuje vraždění Palestinců. Zločinečt...
31. 3. 2026 / Izrael právě bombardoval další sanitku
31. 3. 2026 / O hrůzných neonormalizačních postojích českých médií, ohrožujících ...
31. 3. 2026 / Matěj Metelec Izraelští fašisté prosadili trest smrti pro Palestince
31. 3. 2026 / Ivan Větvička Levné drony s miniaturními jadernými náložemi změní způsob strategi...
31. 3. 2026 / Trumpova zkreslená představa o válce s Íránem naráží na zeď
31. 3. 2026 / Elon Musk a humanoidní roboti
30. 3. 2026 / Channel 4 News: Slovní salát s bohatou zálivkou výhrůžek od muže, k...
31. 3. 2026 / Jednání v Islámábádu signalizují vznik nového čtyřstranného bloku n...
31. 3. 2026 / Netanjahu ustupuje od zákazu vstupu křesťanských představitelů do ...
1. 3. 2026 / Hospodaření Občanského sdružení Britské listy za únor 2026
31. 3. 2026 / Pavlína Antošová Příběh jako paleta možností
31. 3. 2026 / Tomáš Kala Nula: Singularita bez proč
31. 3. 2026 / Beno Trávníček Brodský Utáhněte si opasky vy, kteří to dobře umíte!
31. 3. 2026 / JD Vance označil mimozemšťany za „démony“ a popsal svou posedlost UFO
30. 3. 2026 / Boris Cvek Zpráva Nejvyššího kontrolního úřadu o České republice za rok 2025: ...
31. 3. 2026 / TZ: Zastropování marží pumpařů růst cen nevyřeší.
30. 3. 2026 / Nafta atakuje 50 Kč, je nejdražší v historii. Vládo, nahraďme ji či...
30. 3. 2026 / Pět vlád členských států EU systematicky podrývá právní stát
30. 3. 2026 / Krize na Blízkém východě: Trump prohlásil, že chce „zabavit ropu“ ...
30. 3. 2026 / Matěj Metelec ČR: Nesmyslná zákopová válka
30. 3. 2026 / Je to genocida novinářů
30. 3. 2026 / Jak se společnosti Meta nepodařilo ovlivnit porotu tím, že obviňov...
30. 3. 2026 / BBC: V důsledku Trumpovy války hrozí globální potravinová krize
30. 3. 2026 / Arnošt Kult Krušné hory – cesta ze slepé uličky – řešení vyhovující jak tetřívk...
30. 3. 2026 / Gaza: Vyčerpaní Palestinci se s velkými obtížemi snaží dát svůj ž...
30. 3. 2026 / Aktuální informace o válce na Ukrajině: Zelenskyj uzavírá obranné d...
30. 3. 2026 / Fabiano Golgo Bude vnuk Raúla Castra Trumpovým „Naším člověkem v Havaně“?
30. 3. 2026 / Svým vyjádřením o vedoucích politicích s rukama od krve papež zřejm...
30. 3. 2026 / Fabiano Golgo Rusko už na Česko útočí, jen to není válka, jakou známe
29. 3. 2026 / Boris Cvek Netanjahuovi a Trumpovi díky a oběti a Německo pro nás na omluvu po...
29. 3. 2026 / Fabiano Golgo Izrael je třeba vyloučit z okruhu civilizovaných států
30. 3. 2026 / BBC: Je tohle Trumpovo katastrofální selhání jako někdejší selhání ...
29. 3. 2026 / Trump zvažuje naprostou pošetilost: vyslání pozemních jednotek do Í...
29. 3. 2026 / Krize na Blízkém východě: Netanjahu nařídil rozšíření invaze do ji...
29. 3. 2026 / Izraelská policie zabránila latinskému jeruzalémskému patriarchovi,...
29. 3. 2026 / Channel 4 News: "Čekáme na vás a zapálíme vás"
29. 3. 2026 / Další izraelské válečné zločiny
29. 3. 2026 / ČR: O sobotní demonstraci proti rasismu a fašismu
29. 3. 2026 / Krize na Blízkém východě: Výbuchy v Teheránu, zatímco jemenské hn...
29. 3. 2026 / Třetí protitrumpovské protestní akce „No Kings“, "Nechceme tu žádné...
29. 3. 2026 / Beno Trávníček Brodský Steuern vom Superreichtum
28. 3. 2026 / Boris Cvek Květná neděle a biblická víra
28. 3. 2026 / Channel 4 News: Izrael brutálně vraždí děti a civilisty v Libanonu
28. 3. 2026 / Oba zatčení a obvinění z útoku v Pardubicích mají alibi. Nemohli ta...
28. 3. 2026 / Nikdy nikomu nevadí televizní diskuse bez žen, nikomu nevadí vláda ...
28. 3. 2026 / Rubio důrazně popírá, že by USA požadovaly, aby Kyjev přenechal vý...
28. 3. 2026 / OSN: Zabíjení dětí nikdy nemůže být způsobem, jak řešit rozpory mez...
28. 3. 2026 / Česká demokracie podporou Izraele hrozně trpí
27. 3. 2026 / Channel 4 News: "Mírové rozhovory probíhají velmi dobře"
28. 3. 2026 / Krize na Blízkém východě: Jemenští Húsíové se hlásí k prvnímu útoku...
27. 3. 2026 / Informace, že izraelská armáda pálila cigaretami osmnáctiměsíčního ...
27. 3. 2026 / Válka, která znamenala krok zpět: Jak Trump svými útoky uvrhl USA d...
27. 3. 2026 / Izraelci jsou nadlidi 2
27. 3. 2026 / Beno Trávníček Brodský Daň ze superbohatství
27. 3. 2026 / Krize na Blízkém východě: Izrael „zintenzivní“ útoky na Írán, pro...
27. 3. 2026 / Počet chatbotů umělé inteligence, kteří ignorují lidské pokyny, ros...
27. 3. 2026 / Co mají USA v Íránu za lubem?
27. 3. 2026 / Žhářský útok v Pardubicích: nejen útok na továrnu
27. 3. 2026 / Federální soudkyně se v prvním kole sporu s Pentagonem postavila na...
27. 3. 2026 / Tisková zpráva STEM - Hodnocení 100 dní vlády: veřejnost se v pohle...
27. 3. 2026 / Kvůli nejistotě ohledně jednání s Íránem akcie klesají a ropa zdražuje
27. 3. 2026 / Rusko začalo posílat Íránu drony k válce s USA
27. 3. 2026 / Pentagon se rozhodl přesměrovat dodávky raket Patriot z Ukrajiny na...
27. 3. 2026 / Německo: Razie ve firmě, která provozuje ruskou televizi
27. 3. 2026 / Výsledky voleb ve Slovinsku narušily "Orbánův plán"
27. 3. 2026 / Trumpův tým se připravuje na ropu v ceně až 200 dolarů za barel
27. 3. 2026 / Írán: Verbovány mohou být dvanáctileté děti
27. 3. 2026 / O útoku na židovské sanitky v londýnské čtvrti Golders Green
27. 3. 2026 / Pentagon začíná připravovat "rozhodující úder" na Írán
27. 3. 2026 / Trumpova popularita klesla na nejnižší úroveň
27. 3. 2026 / OSN: Válka v Súdánu se blíží k syrskému bodu zlomu
27. 3. 2026 / Íránská válka poskytuje Číně návod, jak porazit USA
27. 3. 2026 / Nahrazení času u televize čtením nebo prací u stolu může snížit riz...
27. 3. 2026 / Bohumil Kartous Kremelská kolaborantská osa ve střední Evropě a její destrukční dop...
27. 3. 2026 / Izrael donutil víc než milion lidí odejít ze svých domovů v Libanonu
27. 3. 2026 / Dosáhne ropa 160 dolarů?
27. 3. 2026 / Petr Vařeka Lokální politický utilitarismus a paralýza globální spolupráce
27. 3. 2026 / Fabiano Golgo Trumpova „velvyslankyně" v americké televizi CBS ztrácí diváky

Objednat předplatné

Všechno, vůči čemu jsou Britské listy opakem

Primárním obsahem současných novin je komercionalizované zpravodajství zpracované tak, aby zaujalo široké publikum, aby je pobavilo, aby bylo efektivní z hlediska nákladů a aby bylo možno prodat pozornost publika zadavatelům reklamy.

Výsledkem je, že jsou přehlíženy příběhy, které by mohly pohoršit, a přednost dostávají příběhy, které jsou přijatelné a zábavné pro větší počet čtenářů.

Příběhy, jejichž zpracování je nákladné, jsou zlehčovány nebo opomíjeny, nevšímavě jsou přecházeny také ty příběhy, které jsou finančně riskantní.

To vše vede k homogenizaci obsahu novin, k referování o bezpečných otázkách a omezení škály názorů a vyjadřovaných myšlenek.