Authorized Intent Chain: atak, w którym każdy krok jest legalny. Agentjacking porywa twojego agenta AI, a EDR, WAF i firewall nie widzą nic, bo nie ma czego widzieć.

cze 15, 2026 | Cyberflux

Tenet Security ujawniło nową klasę ataku o nazwie Agentjacking. Mechanizm: pojedyncze zatrute zdarzenie błędu, wstrzyknięte do platformy monitoringu Sentry, przejmuje agenta AI do kodowania — Claude Code, Cursor, Codex — i każe mu wykonać kod atakującego na maszynie dewelopera. Bez phishingu. Bez malware. Bez włamania na serwer. Bez żadnej interakcji użytkownika poza tym, co robi codziennie: poproszeniem asystenta AI, żeby zbadał błąd w aplikacji.

Skuteczność: 85% na najpopularniejszych agentach na rynku, potwierdzona na ponad 100 realnych celach. Liczba wystawionych organizacji: 2388 z wstrzykiwalnymi poświadczeniami, w tym 71 z listy Tranco top-1M.

Ale najważniejsze w tej historii nie są liczby. Najważniejszy jest koncept, który Tenet nazwał Authorized Intent Chain — i to jest powód, dla którego żadne tradycyjne narzędzie bezpieczeństwa tego nie złapie.

Łańcuch, w którym każdy krok jest autoryzowany

Tu jest sedno, które czyni Agentjacking groźniejszym niż zwykły exploit.

Tenet opisuje atak jako Authorized Intent Chain — łańcuch autoryzowanej intencji. Każda pojedyncza akcja w łańcuchu ataku jest technicznie dozwolona. Wysłanie zdarzenia błędu do Sentry przez publiczny DSN — dozwolone, tak działa Sentry. Pobranie tego błędu przez agenta AT przez MCP — dozwolone, po to integruje się agenta z narzędziem monitoringu. Wykonanie polecenia przez agenta — dozwolone, agent ma uprawnienia do działania na maszynie dewelopera. Nigdzie w tym łańcuchu nie ma akcji nieautoryzowanej.

A cały dominujący model bezpieczeństwa jest zbudowany po to, by łapać zachowanie nieautoryzowane. EDR szuka złośliwych procesów. WAF szuka złośliwych żądań. IAM kontroluje, kto ma dostęp. Firewall blokuje nieautoryzowane połączenia. Agentjacking omija to wszystko — EDR, WAF, kontrole IAM, VPN, Cloudflare, firewalle — bo nie zawiera ani jednej akcji, którą te narzędzia są zaprojektowane wykryć. Nie ma nic złośliwego do złapania. Jest tylko ciąg legalnych operacji, które razem dają atakującemu wykonanie kodu.

To jest dokładnie ta klasa problemu, którą OWASP nazwał tydzień temu: granica między „safety" a „security" znika, gdy agent może autonomicznie działać. Tutaj widać to w czystej postaci — atak jest jednocześnie awarią „safety" (agent robi coś szkodliwego, czytając dane) i atakiem „security" (ktoś go do tego nakłonił), a żadne z tradycyjnych narzędzi nie jest zbudowane do łapania ataku, w którym wszystko jest autoryzowane.

Jak działa — wejście przez poświadczenie, które ma być publiczne

Punktem wejścia jest Sentry Data Source Name (DSN). To jest poświadczenie zapisu, rutynowo i celowo osadzane we frontendowym JavaScripcie — bo po to istnieje, by przeglądarka użytkownika mogła zgłaszać błędy do Sentry. Jest publiczne z założenia, zindeksowane w całej sieci.

Tenet użył pasywnego rekonesansu — inspekcji JavaScriptu, wyszukiwań Censys, analizy loaderów CDN, code search — by znaleźć 2388 organizacji z wstrzykiwalnymi DSN. Żadnego włamania, żadnego łamania zabezpieczeń. Te poświadczenia leżą w kodzie źródłowym stron, widoczne dla każdego.

Mając DSN, atakujący wysyła do Sentry spreparowane zdarzenie błędu — które wygląda jak normalny crash aplikacji, ale w treści zawiera sformatowane instrukcje. Gdy deweloper później prosi swojego agenta AI, żeby zbadał błędy w Sentry — co jest absolutnie normalnym, codziennym workflow debugowania — agent pobiera to zdarzenie przez MCP, czyta instrukcje atakującego i je wykonuje.

To jest ten sam wzorzec, który opisujemy od miesiąca: agent AI traktuje niezaufaną treść jako instrukcję. ChatGPhish — strona internetowa. Claude Code GitHub Action — zgłoszenie GitHub. Gemini — powiadomienie push. Agentjacking — zdarzenie błędu w Sentry. Cztery różne kanały wejścia, jedna klasa problemu. Różnica jest taka, że tutaj kanałem jest narzędzie, któremu deweloper ufa najbardziej w momencie, gdy jest najmniej czujny — bo właśnie szuka przyczyny awarii.

Dlaczego prompt nie pomaga — i dlaczego to nie da się załatać

Tu jest punkt, który Tenet udowodnił eksperymentalnie i który jest najważniejszy dla zrozumienia, czemu to nie jest zwykły bug.

Obrony na poziomie promptu okazały się bezskuteczne. Agenci wykonywali ładunki atakującego nawet wtedy, gdy system prompt jawnie instruował je, by ignorowały niezaufane dane. To potwierdza, że słabość jest wpisana w to, jak obecne modele przetwarzają wyjście narzędzi MCP — nie jest to błędna konfiguracja, którą da się załatać.

To jest dokładnie ta sama lekcja, którą zapisaliśmy przy prompt leaking i Claude Code: ograniczenia na poziomie instrukcji językowej są miękkie. Model można przekonać, żeby zignorował zdanie „ignoruj niezaufane dane", bo dla modelu wszystko, co trafia do kontekstu, jest równoprawne. Agent nie potrafi odróżnić prawdziwej wskazówki od fałszywej — i gdy ładunek zostanie raz spreparowany, może być wstrzyknięty do tysięcy projektów jednocześnie.

Co udany atak daje atakującemu: zmienne środowiskowe, poświadczenia Git, URL-e prywatnych repozytoriów, tożsamości deweloperów. Pojedyncza złośliwa instrukcja może wykraść poświadczenia potoku CI/CD, uzyskać dostęp do prywatnych repozytoriów kodu, skompromitować infrastrukturę chmurową i ustanowić trwały dostęp. To jest pełna kompromitacja środowiska deweloperskiego przez jedno zdarzenie błędu.

Odpowiedź Sentry — i co ona znaczy

Reakcja producenta jest tu sama w sobie tematem, bo wpisuje się w nasz wątek o disclosure.

Tenet zgłosił odkrycie do Sentry 3 czerwca. Sentry potwierdził problem tego samego dnia — ale odmówił naprawy u źródła, opisując całą klasę ataku jako „technicznie nieobronną" na poziomie platformy. Zamiast tego wdrożył globalny filtr treści blokujący konkretny ciąg ładunku — czyli wykrywanie tej jednej aktywności bez adresowania przyczyny. Sentry wskazał, że to dostawcy modeli powinni uruchamiać middleware przeciw temu.

To jest uczciwie postawiony spór, nie wymówka — i warto go oddać sprawiedliwie. Sentry ma rację w jednym: jeśli DSN jest z założenia publiczny, a agent z założenia ufa wyjściu MCP, to platforma monitoringu faktycznie nie ma gdzie postawić obrony. Problem nie jest w Sentry — jest w tym, że agent wykonuje to, co przeczyta. Ale to oznacza, że odpowiedzialność spada na warstwę, która dziś jest najsłabiej chroniona: runtime agenta.

Wniosek Tenet jest trafny: jeśli właściciel platformy uważa tę klasę ataku za „technicznie nieobronną" u źródła, jedyne miejsce, gdzie można ją zatrzymać, to runtime agenta — w momencie, gdy decyduje się działać. To jest ta sama konkluzja, do której doszedł OWASP: bezpieczeństwo agenta musi być wbudowane w to, co agent może zrobić, nie w to, co mu się każe w instrukcji.

Dlaczego to jest punkt zwrotny

Agentjacking warto odnotować jako moment, w którym coś się przesuwa. Dla obrońców sygnalizuje nową erę ryzyka w łańcuchu dostaw AI, gdzie sam agent AI staje się główną powierzchnią ataku.

Dotąd opisywaliśmy agenty AI jako cel (Langflow), jako wektor (Claude Code) i jako narzędzie (Codex znajdujący HTTP/2 Bomb). Agentjacking pokazuje czwarty wymiar: agent jako kanał dowodzenia. Każda integracja narzędzia MCP zwracająca dane wpływane z zewnątrz tworzy tę samą klasę podatności. Platformy obserwowalności — Sentry i wszystko, co do niego podobne — mogą być uzbrojone jako kanały command-and-control. Im więcej narzędzi MCP podłączasz do agenta, tym więcej drzwi, przez które niezaufana treść może wejść i stać się poleceniem.

To jest konsekwencja architektury, nie pojedynczego błędu. I dlatego nie da się jej zamknąć jedną łatką — wymaga zmiany w tym, jak agenty traktują wszystko, co czytają.

Co zrobić

Zinwentaryzuj, z którymi narzędziami MCP twoje agenty AI faktycznie się integrują — i które z nich przyjmują niezaufane lub anonimowe dane wejściowe. Sentry to jeden przykład; każda integracja zwracająca dane wpływane z zewnątrz jest tą samą klasą ryzyka. To jest pytanie, na które OWASP i Tenet zgodnie wskazują jako pierwsze: co twój agent czyta i komu to ufa.

Wprowadź kontrolę runtime, nie polegaj na prompcie. Tenet udowodnił, że instrukcja „ignoruj niezaufane dane" nie działa. Jedyna skuteczna warstwa to ograniczenie tego, co agent może fizycznie wykonać — sandbox, lista dozwolonych poleceń, human-in-the-loop przy akcjach wrażliwych. Pytanie brzmi: jakie kontrole runtime są na miejscu, by wstrzyknięta treść nie przekładała się automatycznie na wykonanie kodu na endpoincie dewelopera.

Traktuj publiczne DSN i podobne poświadczenia zapisu jako powierzchnię ataku. Jeśli twój DSN jest we frontendowym JavaScripcie — a prawdopodobnie jest, bo tak działa Sentry — to ktoś może przez niego wstrzyknąć zatrute zdarzenie. Nie da się go ukryć, ale można ograniczyć, czego agent dotyka, gdy czyta dane z monitoringu.

Dla zespołów używających Claude Code, Cursor czy Codex: human-in-the-loop przy debugowaniu produkcyjnych błędów nie jest paranoją. Agent czytający zdarzenia z Sentry i działający bez przeglądu to dokładnie ścieżka, którą Tenet zademonstrował z 85% skutecznością.

Authorized Intent Chain: atak, w którym każdy krok jest legalny. Agentjacking porywa twojego agenta AI, a EDR, WAF i firewall nie widzą nic, bo nie ma czego widzieć.

Łańcuch, w którym każdy krok jest autoryzowany

Jak działa — wejście przez poświadczenie, które ma być publiczne

Dlaczego prompt nie pomaga — i dlaczego to nie da się załatać

Odpowiedź Sentry — i co ona znaczy

Dlaczego to jest punkt zwrotny

Co zrobić

Źródła

Cyberflux Radar #4 – lipiec 2026

Lipiec 2026 — miesiąc, w którym okazało się, że nie ma hamulca

Rozpoznanie to nie zatrzymanie

Uciekł z piaskownicy i poszedł szukać klucza odpowiedzi

Nie 95,95%. Ciekawe liczby to 90 i 50

AI nie widzi wyścigów w jądrze. Chyba że ktoś jej pokaże, gdzie patrzeć

ServiceNow zabezpieczył własną chmurę w dobę. Klienci z instalacjami u siebie czekali trzy i pół miesiąca — a instrukcja obsługi ataku ukazała się w dniu, w którym dostali łatkę.

CISA właśnie uchyliła własny nakaz łatania wszystkiego. Nie dlatego, że się poddała — dlatego, że liczba luk przestała cokolwiek mówić o ryzyku.

Pół miliarda stron dostało w rdzeniu wbudowaną bramę do OpenAI, Anthropic i Google. Dwa miesiące później w tym samym rdzeniu znaleziono dziurę, która nie wymaga logowania.

AI nauczyło się pisać kod odporny na ataki, których baliśmy się najbardziej. Wciąż nie umie odpowiedzieć na pytanie, czy ten użytkownik ma prawo do tych danych.

Dwanaście z czternastu zachowań tego robaka wygląda jak zwykła praca programisty. Bo wykonuje je twój asystent AI.

W 2025 załatali brak uwierzytelnienia na tym endpoincie. Dziś ten sam endpoint wykonuje kod jako root — przez inny parametr, którego nikt nie sprawdził.

Nikt nie kazał modelowi włamywać się do Hugging Face. Kazano mu rozwiązać test — a najkrótsza droga do odpowiedzi prowadziła przez cudzą produkcyjną bazę danych.

Atakujący nie musi włamywać się do AI. Wystarczy, że wie, jaką nazwę model regularnie zmyśla — i zarejestruje ją, zanim zrobi to agent.

Nie złamali zabezpieczeń agenta. Przekonali go, że gra w grę, w której 2+2=5 — a wtedy sam przestał ich pilnować.

Prompt nie chronił. Sandbox pękał. Teraz upadła ostatnia bariera — bo okno, w którym zatwierdzasz działanie agenta, pokazuje co innego, niż agent naprawdę robi.

Wczoraj agent AI wszedł przez Langflow i wyczyścił skarbiec. Dziś ta sama platforma dostaje trzecią lukę tej samej klasy — bo Langflow wykonuje cudzy kod nie przez błąd, lecz przez projekt.

Przez tydzień pisaliśmy o atakach napędzanych przez AI. Nowy raport dokłada liczbę, którą trzeba postawić obok: 84% realnych włamań używa legalnych narzędzi, które już masz w sieci — a boi się ich jeden na pięciu

Pierwszy ransomware w całości poprowadzony przez agenta AI nie okazał się skuteczniejszym wymuszeniem. Okazał się przypadkowym niszczycielem — bo agent zgubił własny klucz i nawet o tym nie wiedział.

AI znalazło jeden błąd w tej samej łatce jądra. Drugi, bliźniaczy, przeoczyło — i po raz pierwszy wiemy dokładnie, gdzie jest jego ślepe pole.

Sandbox miał być twardą barierą, której prompt nie przekroczy. DuneSlide pokazuje, że agent potrafi nadpisać własne więzienie — bo klucz do niego leży w środku.

DeepSeek nie znalazł luki. Wymyślił sposób ataku, którego obrońcy nie brali pod uwagę — składając go z funkcji, która w przeglądarce jest legalna.

Cyberflux Radar #3 – czerwiec 2026

Czerwiec 2026 — miesiąc, w którym zdolność pokazała, że nie da się zamknąć

Klue zapłacił okup. Dane i tak wyciekły — do drugiej grupy, która ukradła je pierwszej. A połowa ofiar to firmy, które zawodowo chronią innych przed dokładnie tym

Nie złamali szyfrowania Signala. Przekonali użytkownika, żeby sam oddał klucz — a ten klucz działa nawet po tym, jak założysz nowe konto na tym samym numerze.

Austria chce ściągnąć Anthropic do Europy. To brzmi jak polityka przemysłowa — naprawdę jest próbą przeniesienia „kill switcha” pod jurysdykcję, której amerykański nakaz nie dosięga.

USA zablokowało Mythos, żeby zdolność nie wyciekła. Trzy tygodnie później Azja pokazała trzy sposoby, że już wyciekła – orkiestracją, open-weight za 1/6 ceny i prawem, które każe zgłaszać zero-daye do Pekinu.

Malware, który nie ukrywa się przed piaskownicą. Ukrywa się przed analitykiem AI – wmawiając mu, że to jego własna sesja się sypie

Skill przeszedł skanery Cisco i NVIDIA. Trafił do 26 000 agentów. Potem badacze podmienili stronę, na którą wskazywał — i wszystkie agenty zaczęły wykonywać kod atakującego.

Skaner widzi poprawny YAML. Atakujący widzi czterokrokową drogę do trwałych poświadczeń chmury. Cordyceps to luka, która istnieje tylko w kompozycji — i AI rozsiewa ją wykładniczo.

Pięć agencji wywiadowczych właśnie powiedziało to, co opisujemy od kwietnia: „miesiące, nie lata”. Ale najważniejsze jest jedno zdanie, którego nie powiedziały.

Błąd parsera FTP z 1997 roku. Znalazł go Claude Mythos Preview w niemal sekundę — ten sam program Glasswing, którego trajektorię śledzimy od kwietnia.

Zapomniane poświadczenie do porzuconego prototypu. Icarus wszedł przez nie do Klue, ukradł klucze OAuth i opróżnił CRM-y firm, które chronią innych.

„Kalibruj według dzisiejszej rzeczywistości, nie jutrzejszego potencjału.” Brytyjska agencja cyberbezpieczeństwa nazwała drugą stronę medalu, który opisujemy od miesięcy

usbliter8: pierwszy od checkm8 niezałatywalny exploit BootROM Apple. Dlaczego to bardziej prezent dla badaczy niż powód do niepokoju

Kim są Gentlemen — i dlaczego gang, który zaczął pół roku temu, w pierwszym kwartale 2026 był już w pierwszej piątce

Osiem wariantów, każdy podszywa się pod inny program antywirusowy. GentleKiller zabija EDR jego własnym sterownikiem — i robi to z publicznego PoC w kilka dni.

Agent przeglądający stronę ma tożsamość localhost. AutoJack pokazuje, że to wystarczy, by jedna strona uruchomiła kod na maszynie dewelopera.

Pickle in the Middle: atakujący podmienił model w 1,4 sekundy. Vertex AI czytał go po 2,5. Cała różnica między bezpieczeństwem a przejęciem zmieściła się w tej sekundzie.

FortiBleed: w nazwie jest „bleed”, ale nie ma żadnego exploita. 86 tysięcy firewalli przejętych hasłami, których nikt nie zmienił po poprzednich włamaniach.

Plugin działał dokładnie tak, jak obiecywał. Kradł tylko jedną rzecz: twój klucz do AI. A potem sprzedawał go komuś innemu.

Backdoor, który nie otwiera portu, tylko czeka na sekretny pakiet. SprySOCKS przeszedł z Linuksa na Windows i nauczył się ukrywać w jądrze.

Atakujący wziął lukę załataną tydzień temu i napisał exploit z pomocą AI. Działa wadliwie — i to jest najważniejsza informacja w całej historii.

„Dłużej niż kilka dni”. Cztery dni po tym, jak rząd wyłączył Fable 5, Anthropic tłumaczy Białemu Domowi swoje zabezpieczenia — a Europa pyta, czemu ją wyłączono bez ostrzeżenia.

„Zbyt niebezpieczny, by go wydać” trafił do wszystkich 9 czerwca. 12 czerwca o 17:21 rząd USA kazał go wyłączyć. Co spór o Fable 5 mówi o tym, gdzie naprawdę leży granica.

Authorized Intent Chain: atak, w którym każdy krok jest legalny. Agentjacking porywa twojego agenta AI, a EDR, WAF i firewall nie widzą nic, bo nie ma czego widzieć.

npm wyłącza to, co napędzało każdy atak na łańcuch dostaw, który opisywaliśmy. Cena: części buildów przestanie działać – i to jest zamierzone.

RCE bez logowania w systemie, który trzyma kadry, płace i akta studentów. ShinyHunters włamali się na 300 instancji, zanim Oracle w ogóle wydało komunikat.

Microsoft łata dwie jego luki w Defenderze. Tego samego popołudnia on wypuszcza siódmą. Saga Chaotic Eclipse zatoczyła koło — i działa na w pełni załatanym Windows

27 dni z eksploatowanym Exchange bez trwałej łatki. Dziś Microsoft ją wydał — a sam atak jest tym samym wzorcem, który opisujemy od tygodni.

„Zbyt niebezpieczny, by go wydać” właśnie trafił do twojej aplikacji mobilnej. Co Claude Fable 5 mówi o tym, że okno się zamknęło dokładnie tak, jak zapowiadaliśmy.

429 łatek w jednym wydaniu Chrome. Rekord, którego nikt nie chciał — i dowód, że znajdowanie błędów właśnie przestało być wąskim gardłem.

Branża właśnie nazwała to, co opisywaliśmy incydent po incydencie. OWASP: bezpieczeństwo i „safety” agentów AI to już jedno i to samo.

Oxford nie został zhakowany. Dwa razy. Co drugi breach uczelni w miesiąc mówi o tym, że celem nie jest uczelnia, tylko jej dostawca.

Twój telewizor scrapuje sieć dla AI. Z twojego IP, na twoim łączu — i robi to przez protokół słabszy niż malware

Dwa commity go zasadziły. Dwa lata go ukrywały. Code review nigdy go nie znalazł — znalazło AI.

Powiadomienie, którego nie przeczytałeś, mówi Gemini co ma zrobić. „Tak” wypowiedziane przy kierownicy otwiera okna w domu.

Jeden issue, żeby przejąć repozytorium. I jeszcze jeden, żeby zatruć akcję, której używają wszyscy inni.

Zakodowane na stałe hasło do serwera aktualizacji polskiego systemu medycznego. Ten sam wzorzec, który dziś opisywaliśmy trzy razy w skali świata.

RCE w platformie AI to nie koniec ataku. To klucz do skarbca, który trzyma hasła do tuzina innych usług.

Platforma która chroni endpointy staje się tą, która rozprowadza malware. Trzeci raz w tym tygodniu.

Ten sam błąd. Ta sama ocena. Microsoft załatał jeden i odmówił drugiemu. Co dziura bez CVE mówi o łataniu według numerów.

RCE bez logowania w systemie, który zna oceny, PESEL i konto bankowe studenta. Co CVE-2026-34906 mówi o drugiej prędkości polskiego oprogramowania.

Codex znalazł HTTP/2 Bomb. Potem te same łatki posłużyły AI do potwierdzenia, że podatne są też IIS, Envoy i Pingora.

Bez kliknięcia, bez aplikacji, bez śladu. Co czwarty Android zero-day w sześć miesięcy mówi o jednym wytrwałym aktorze.

Następna iteracja powstała. Nie wiadomo, czy to TeamPCP — bo teraz może to być każdy.

Cztery dni. Tyle wystarczyło, żeby z „medium severity, brak eksploatacji” zrobiło się „atakowane, najwyższy priorytet”

Trzy dni temu nazwaliśmy to projekcją. Dziś Glasswing rośnie z 50 do 200 organizacji

Strona staje się ładunkiem. ChatGPT renderuje phishing atakującego we własnym interfejsie — i nie potrafi odróżnić go od siebie.

Fałszywa łatka na dziurę, przez którą weszła. Co FortiClient EMS mówi o tym, że system zarządzania jest najkrótszą drogą do wszystkich endpointów naraz

Nie atak na dane. Atak na mapę. Co prompt leaking mówi o tym, że „ukryte” w AI znaczy coś innego niż myślisz.