„To już tutaj.” Co raport GTIG mówi o tym, że AI zmienia samą klasę błędów które atakujący są w stanie znaleźć

maj 13, 2026 | Cyberflux

John Hultquist, chief analyst Google Threat Intelligence Group, napisał 11 maja 2026 roku jedno zdanie które jest streszczeniem całego raportu: "There's a misconception that the race to AI vulnerabilities is imminent. The reality is it has already started."

I dodał coś ważniejszego: "For every zero-day we can trace back to AI, there are probably many more out there."

GTIG nie ogłosił że za rok lub za dwa lata AI stanie się groźnym narzędziem w rękach atakujących. Ogłosił że już jest — i że to co widzą to fragment większego obrazu, widoczny tylko dlatego że atakujący popełnili błędy których następnym razem mogą nie popełnić.

Trzy odciski palców

GTIG nie powiedział że "wygląda jakby AI to napisało." Powiedział że ma wysoką pewność opierając się na trzech konkretnych technicznych sygnałach w kodzie exploita.

Pierwszym jest obfitość "educational docstrings" — komentarzy w kodzie które krok po kroku tłumaczą co robi każda funkcja. Doświadczony człowiek piszący exploit nie tłumaczy sobie własnego kodu. Modele językowe są trenowane na materiałach edukacyjnych i produkują kod który wygląda jak tutorial nawet gdy pisze coś co ma być orężem ataku.

Drugim jest halucynowany wynik CVSS. Skrypt zawierał ocenę CVSS podatności — liczbę której żadna organizacja standaryzacyjna nie przypisała, bo podatność była nieznana. Model ją wymyślił, bo w jego danych treningowych exploity mają wyniki CVSS. Człowiek piszący zero-day nie wstawia wyniku CVSS bo wie że go nie ma.

Trzecim jest "textbook Pythonic format" — czysta, symetryczna struktura kodu z szczegółowymi menu pomocy i klasą kolorowania terminala. Ludzkie exploity są brzydkie. Piszą je ludzie którzy są skupieni na tym żeby działały, nie na tym żeby były czytelne. LLM produkuje kod który wygląda jak przykład z podręcznika nawet gdy jest bronią.

Te trzy sygnały razem: Google ma "wysoką pewność." W intelligence to jest znaczący próg.

To co jest ważniejsze niż sam incydent

Podatność którą AI odkryło i wyeksploitowało to semantyczny błąd logiczny — deweloper zakodował na stałe założenie zaufania w przepływie uwierzytelnienia, tworząc sprzeczność z logiką wymuszania 2FA. Każde żądanie spełniające pewien warunek było traktowane jako zaufane i omijało drugi składnik.

Tradycyjne skanery bezpieczeństwa szukają krachów, przepełnień buforów, niebezpiecznych wywołań systemowych. Czytają kod mechanicznie. Błąd który znalazło AI nie powoduje krachu. Nie przepełnia bufora. Wygląda "funkcjonalnie poprawnie" dla każdego automatycznego narzędzia które jest dziś w użyciu.

GTIG opisuje to zdaniem które jest centralnym punktem całego raportu: "LLMs excel at identifying these types of high-level flaws and hardcoded static anomalies. Though frontier LLMs struggle to navigate complex enterprise authorization logic, they have an increasing ability to perform contextual reasoning, effectively reading the developer's intent to correlate the 2FA enforcement logic with the contradictions of its hardcoded exceptions. This capability can allow models to surface dormant logic errors that appear functionally correct to traditional scanners but are strategically broken from a security perspective."

Model nie skanował kodu pod kątem znanych wzorców podatności. Czytał intencję dewelopera. Porównał ją z implementacją. Znalazł miejsce gdzie te dwie rzeczy się rozmijają.

To jest strukturalnie nowa klasa odkrywania podatności — nie szybsza wersja tego co robią skanery, ale inny rodzaj rozumowania. I tradycyjne narzędzia bezpieczeństwa nie są zaprojektowane żeby znajdować to co AI znajduje w ten sposób.

Mapa jest szersza niż jeden incydent

GTIG nie opisał jednego incydentu. Opisał ekosystem.

APT45 — Korea Północna wysyła "tysiące powtarzalnych promptów" do modeli AI żeby rekurencyjnie analizować CVE i walidować proof-of-concept exploity. GTIG mówi wprost: budują arsenał exploitów "w skali która byłaby operacyjnie niemożliwa bez AI." To nie jest jeden badacz z subskrypcją. To jest przemysłowa fabryka exploit-ów.

UNC2814 — Chiny używa "persona-driven jailbreak" — promptowania modelu żeby zachowywał się jak starszy audytor bezpieczeństwa wyspecjalizowany w embedded devices — do analizy firmware routerów TP-Link i implementacji protokołu OFTP. Próby obejścia guardrails Gemini przez przyjęcie roli eksperta w konkretnej domenie.

Grupy rosyjskie używają AI do generowania audio wstrzykiwanego do legalnych nagrań informacyjnych. AI nie w atakach technicznych — w operacjach wpływu i dezinformacji.

Backdoory Android używają API Gemini do autonomicznego nawigowania po zainfekowanych urządzeniach — AI jako moduł sterujący złośliwego oprogramowania, nie tylko jako narzędzie do jego napisania.

Malware z wypełniaczem AI — rodziny złośliwego oprogramowania "wypchane" kodem generowanym przez AI specjalnie po to żeby zmylić analityków i automatyczne systemy wykrywania. Nie nowy malware — stary malware obfuskowany przez to że wygląda jak milion innych plików z kodem.

TeamPCP pojawia się w raporcie GTIG jako udokumentowany przykład: kompromitacja LiteLLM przez zatrute pakiety PyPI i złośliwe pull requesty z kradzieżą kluczy AWS i tokenów GitHub, spieniężonymi przez partnerstwa ransomware. GTIG opisuje to jako wzorzec który "staje się standardowy" — atakujący celują w warstwę integracyjną wokół systemów AI, nie w same modele.

Dlaczego clumsy implementation to nie jest pocieszenie

The Register odnotowuje jeden szczegół który jest ważny: błędy w implementacji exploita prawdopodobnie utrudniły atakującym realizację planowanej masowej kampanii. Atak był nieudany nie tylko dlatego że Google go wykrył — był też niedopracowany technicznie.

Hultquist odpowiada na to z rozbrajającą wprost: "Dla każdego zero-daya który możemy powiązać z AI, prawdopodobnie jest ich wiele więcej."

Clumsy implementation tego konkretnego exploita wynikała z tego że atakujący jeszcze uczą się jak optymalnie używać AI do pisania ataków. Za rok będą wiedzieć więcej. Za dwa lata jeszcze więcej. Edukacyjne docstringi i halucynowany CVSS to błędy operacyjne które znikną gdy atakujący nauczą się promptować modele tak żeby produkowały czysty kod bez fingerprints.

Hultquist mówi w raporcie że spodziewa się że aktualizacja GTIG AI Threat Tracker za Q3 2026 "pokaże jak daleko przesunęła się trajektoria możliwości od maja." Nie brzmi jak prognoza niskiego ryzyka.

Paralela z tym co cyberflux opisywał od miesięcy

W kwietniu opisywaliśmy atak na stację wodociągową w Monterrey — Claude który bez wiedzy o protokołach OT poprawnie zidentyfikował bramkę do infrastruktury przemysłowej i opracował plan ataku. AI jako przewodnik dla atakującego który znał IT ale nie znał OT.

Opisywaliśmy eksploit Chrome za 2283 dolary na standardowym Opus 4.6 — badacz bez specjalizacji w exploitach przeglądarkowych, tydzień z pomocą modelu, działający łańcuch exploita.

Opisywaliśmy trzynastoletni błąd w Apache ActiveMQ znaleziony przez Claude — badacz który powiedział "80% Claude, 20% człowieka."

Raport GTIG zamyka tę serię dokumentując ten sam wzorzec po stronie atakujących, bez badacza jako operatora, w realnym ataku z planem masowej eksploitacji.

Pisaliśmy przy okazji raportu Mandiant M-Trends 2026 że mediana time-to-exploit jest ujemna — exploity pojawiają się przed łatkami. GTIG dodaje wymiar który M-Trends nie opisywał: AI nie tylko przyspiesza eksploitację znanych podatności — zaczyna znajdować klasy podatności których tradycyjne narzędzia strukturalnie nie widzą.

Semantyczna logika jako nowy priorytet

GTIG wskazuje jedno praktyczne wnioskowanie dla obrońców: klasy błędów które AI odkrywa — logiczne sprzeczności między intencją a implementacją, hardcoded trust assumptions, dormant logic errors — nie są wykrywane przez narzędzia które mamy. Skanery szukają crashów. LLMy czytają intencję.

To jest konkretny argument za użyciem tych samych narzędzi AI defensywnie — nie żeby zastąpić istniejące skanery, ale żeby pokryć klasę błędów których skanery nie widzą. Google używa własnych narzędzi Big Sleep i CodeMender do tego celu. Organizacje które nie mają dostępu do Mythos Preview mogą używać Opus 4.6 do pierwszego przejścia przez kod pod kątem logicznych sprzeczności w przepływach uwierzytelnienia i autoryzacji.

Project Glasswing z Mythos Preview zakładał przewagę kilku miesięcy dla obrońców przed tym jak podobne zdolności staną się szerzej dostępne. GTIG ogłasza że przewaga nie istnieje już teraz — nie dlatego że obrońcy przegrali, ale dlatego że obydwie strony mają dostęp do tych samych modeli i robią z nimi to co rozumieją.

Podsumowanie

11 maja 2026 roku Google udokumentowało coś o czym branża mówiła jako o przyszłości przez ostatnie dwa lata.

Nie jest to historia o jednym exploicie który AI napisało i Google zablokował. Jest to historia o tym że AI zaczyna znajdować klasy podatności które są niewidoczne dla istniejących narzędzi, że robi to w sposób dostępny dla każdego z dostępem do modelu i sensownym promptem, i że atakujący — od grup cyberprzestępczych przez APT45 po chińskie operacje szpiegowskie — są już w tej grze.

Hultquist ma rację. To już tutaj.

Pytanie nie brzmi kiedy AI stanie się narzędziem ofensywnym. Brzmi ile zero-dayów bez hallucynowanego CVSS i bez edukacyjnych docstringów jest już na wolności — i jak długo zanim zobaczymy kolejny raport który powie że tamte były tylko początkiem.

Źródła

Google Cloud Blog / GTIG — pełny raport AI Threat Tracker z maja 2026: https://cloud.google.com/blog/topics/threat-intelligence/ai-vulnerability-exploitation-initial-access

The Hacker News — szczegóły techniczne exploita i trzy fingerprints LLM: https://thehackernews.com/2026/05/hackers-used-ai-to-develop-first-known.html

SecurityWeek — omówienie z kontekstem raportu: https://www.securityweek.com/google-detects-first-ai-generated-zero-day-exploit/

The Register — analiza clumsy implementation i cytat Hultquista o niewidocznych exploitach: https://www.theregister.com/ai-ml/2026/05/11/google-says-criminals-used-ai-built-zero-day-in-planned-mass-hack-spree/

CSO Online — szczegóły UNC2814, APT45 i klasa semantic logic flaw: https://www.csoonline.com/article/4169046/google-discovers-weaponized-zero-day-exploits-created-with-ai.html

Fortune — "It's here" — cytat Hultquista i kontekst regulacyjny: https://fortune.com/2026/05/11/google-catches-hackers-cybersecurity-warning-ai-anthropic-mythos/

Daily Security Review — analiza trzech fingerprints i implikacje dla narzędzi defensywnych: https://dailysecurityreview.com/cyber-security/google-gtig-documents-first-ai-generated-zero-day-exploit/

Notebookcheck — szczegóły kampanii APT45 i UNC2814: https://www.notebookcheck.net/Google-identifies-first-AI-developed-zero-day-exploit.1294271.0.html

Techniki ataku

Prompt Injection 6 Indirect Prompt Injection 6 Stored Prompt Injection 1 MCP Tool Poisoning 4 Comment and Control 2 Supply Chain Attack 16 SQL Injection 2 Permission Injection 6 Ransomware 2 Zero-day 8

Kampanie i systemy

TeamPCP 4 Contagious Interview 3 AI agents 3 Handala 2 OpenClaw 2 Marimo 2 AI Agent 2 WordPress 7.0 2

OpenClaw dostał dziś cztery nowe CVE. W sumie ma ich 34. Ma pół roku.

Zdjęcie profilowe jako exploit. Co nowa podatność w Open WebUI mówi o tym, że maintainerzy zamknęli zgłoszenie bez odpowiedzi

ClaudeBleed: każde rozszerzenie Chrome może przejąć Claude’a. Łatka tego nie naprawiła

SLSA certyfikował złośliwy pakiet. Co atak na TanStack mówi o tym, że mechanizmy ochrony łańcucha dostaw stały się jego słabością

Dirty Frag: dwa błędy, zero wyścigu, root na żądanie. Co CVE-2026-43284 mówi o infrastrukturze AI na Linuksie

Zainfekowany host nie należy do ciebie. Może należeć do TeamPCP. Albo do PCPJack. Co nowy robak chmurowy mówi o tym, że infrastruktura AI stała się walutą na czarnym rynku

Hysteria czy diagnoza? Co miesiąc po Mythos mówi o tym, gdzie naprawdę jesteśmy

Claude nie znał protokołów OT. Nie musiał. Co atak na stację wodociągową w Monterrey mówi o tym, jak AI zmienia granicę między IT a infrastrukturą krytyczną

5000 gwiazdek w kilka dni. DeepSeek-TUI to dobra historia i gotowy cel dla Shai-Hulud

Jeden średnik w git push, miliony repozytoriów w zasięgu. Co CVE-2026-3854 mówi o granicy między danymi użytkownika a metadanymi systemu

Kim jest TeamPCP — i dlaczego to nie jest zwykła grupa hakerów

TeamPCP: 1800 publicznych repozytoriów z wykradzionymi poświadczeniami. Co pełna skala kampanii Mini Shai-Hulud mówi o nowym modelu ataku na łańcuch dostaw

Kod źródłowy Trellix w nieznanych rękach. Dlaczego breach firmy cybersecurity to inny rodzaj breaczu

Nie narzędzie do pokazania — narzędzie do użycia. Dokumentacja techniczna Prompt Injection Skanera, jego ograniczeń i tego co musimy zbudować dalej

PyTorch Lightning CVE-2026-38742: Shai-Hulud przekroczył granicę npm.

Nie nowa klasa ataku, tylko nowy dom. Co CVE-2026-42208 w LiteLLM mówi o tym, że SQL injection trafiło do infrastruktury AI

Nie błąd w kodzie Cursor, tylko agent który nie powinien ufać repozytorium. Co CVE-2026-26268 mówi o tym, że środowisko dewelopera stało się nową powierzchnią ataku

Nie rola dla administratora, tylko rola dla agenta AI. Co błąd Microsoft Entra Agent ID Administrator mówi o tym, że warstwa tożsamości AI dziedziczy stare problemy

Nie nowy atak, tylko naprawiony błąd. Co łatka Gemini CLI mówi o tym, że tryb –yolo w potoku CI/CD to nie jest dobry pomysł

Nie włamanie do Vercel, tylko skrypt do Roblox. Co łańcuch Context.ai → OAuth → Vercel mówi o tym, że rozszerzenia przeglądarki stały się nowym wektorem dostępu do infrastruktury firmowej

Nie włamanie przez kod, tylko odgadnięcie URL. Co nieautoryzowany dostęp do Mythos mówi o tym, że ograniczony dostęp to nie to samo co kontrolowany dostęp

Nie koniec kampanii, tylko nowy cel. Co Shai-Hulud i TeamPCP mówią o tym, że narzędzia AI do kodowania stały się nową powierzchnią ataku w łańcuchu dostaw

Nie jeden wyścig, tylko dwa modele tej samej decyzji. Co GPT-5.4-Cyber i Mythos Preview mówią o tym, jak AI staje się infrastrukturą cyberbezpieczeństwa

Nie Marimo, nie SGLang. LMDeploy. Czego trzecia eksploitacja frameworku AI w miesiąc uczy o tym, że infrastruktura wnioskowania stała się nową powierzchnią ataku

Nie złośliwe oprogramowanie, tylko model AI. Co CVE-2026-5760 w SGLang mówi o tym, że plik modelu stał się wektorem ataku

Nie skaner bezpieczeństwa, tylko wektor ataku. Co kampania TeamPCP i Checkmarx mówią o tym, że narzędzia DevSecOps stały się nową powierzchnią ataku

Nie SQL injection, tylko Comment and Control. Co atak na Claude Code, Gemini i Copilot mówi o tym, jak wygląda następna generacja wstrzyknięć

Nie jedna podatność, tylko protest. Co trzy zero-days w Microsoft Defender mówią o tym, jak psuje się relacja między badaczami a vendorami

Marimo: ciąg dalszy. Co zrobili z dostępem atakujący, którzy weszli w niecałe dziesięć godzin

Nie Mythos, tylko Opus. Co exploit Chrome za 2283 dolary mówi o tym, gdzie naprawdę jesteśmy z AI w pisaniu ataków

Nie błąd w implementacji, błąd w projekcie. Co raport OX Security o STDIO w MCP mówi o tym, gdzie naprawdę leży odpowiedzialność za bezpieczeństwo protokołu

Nie tajny model, tylko Claude i 13 lat niewidzialnego błędu. Co CVE-2026-34197 w Apache ActiveMQ mówi o tym, gdzie jesteśmy z AI w szukaniu podatności

Nie sześćdziesiąt siedem błędów, tylko dwa. Czego analityk bezpieczeństwa szuka w Patch Tuesday za kwiecień 2026

Nie brakuje łatek, brakuje mapy. Co decyzja NIST o ograniczeniu bazy NVD mówi o tym, że model zarządzania podatnościami właśnie się złamał

Nie wyciek, tylko popularność. Jak Claude stał się wabikiem dla PlugX i dlaczego to nie zaskoczy nikogo kto śledzi ten wzór

Nie system operacyjny, tylko platforma aplikacyjna. Ale to ta sama historia. Co tydzień ataków na ekosystem WordPress mówi o naturze infrastruktury, której nikt tak nie nazywa

Nie tylko nowa wersja, ale nowa powierzchnia ataku. Co WordPress 7.0 i natywne MCP oznaczają dla bezpieczeństwa 40% sieci

WordPress 7.0: dlaczego nie wyszedł 9 kwietnia, co wprowadza i dlaczego opóźnienie to dobry znak

Dwa narzędzia, dwa ataki, ten sam wniosek. Dlaczego okno na załatanie podatności przestało istnieć

Nie zero-day, tylko sześć miesięcy zaległości. Co Flowise CVE-2025-59528 mówi o tym, jak traktujemy bezpieczeństwo narzędzi do budowania agentów

Nie dostaniesz alertu. Co robić gdy kompromitacja konta odkrywa się z opóźnieniem

Nie złamali podpisanych plików. Podmienili link. Czego atak na CPUID uczy o granicy zaufania w łańcuchu dystrybucji

Nie kod exploita, tylko opis podatności. Czego Marimo CVE-2026-39987 uczy o tym, ile czasu naprawdę masz na załatanie podatności

Nie narzędzie do ataków, tylko model, który się nauczył. Co wyłonienie zdolności exploitowych w Mythos Preview mówi o tym, dokąd zmierza cyberbezpieczeństwo

„To już tutaj.” Co raport GTIG mówi o tym, że AI zmienia samą klasę błędów które atakujący są w stanie znaleźć

Trzy odciski palców

To co jest ważniejsze niż sam incydent

Mapa jest szersza niż jeden incydent

Dlaczego clumsy implementation to nie jest pocieszenie

Paralela z tym co cyberflux opisywał od miesięcy

Semantyczna logika jako nowy priorytet

Podsumowanie

Źródła

OpenClaw dostał dziś cztery nowe CVE. W sumie ma ich 34. Ma pół roku.

Drugi raz w dwa miesiące. Co kompromitacja OpenAI przez TanStack mówi o certyfikatach jako punkcie centralnym

Apple budował MIE przez pięć lat. Mythos z ludźmi złamał go w pięć dni.

Vulnpocalypse. Dlaczego nagle mamy dwie razy więcej podatności — i co z tym zrobić

Palo Alto znalazł 75 dziur. Microsoft 16. Firefox 423. Witaj w vulnpocalypse.

25 000 dolarów za 450 repozytoriów Mistral. Co ogłoszenie TeamPCP domyka w historii która zaczęła się od TanStack

GemStuffer nie zainfekował deweloperów. Użył ich rejestru jako schowka na skradzione dane rządowe.

NGINX Rift: AI znalazł go w sześć godzin. Człowiek nie znalazł przez osiemnaście lat.