Nie tajny model tylko plik konfiguracyjny. Co Pentest Agent Suite mówi o tym, gdzie jesteśmy z AI w ofensywnym bezpieczeństwie

maj 26, 2026 | Cyberflux

Claude Code, Cursor, Gemini CLI, OpenClaw, HackerOne

W czerwcu 2025 roku XBOW — firma założona przez twórcę GitHub Copilot, z zespołem oryginalnych inżynierów Copilot i 237 milionami dolarów finansowania — osiągnęła coś bezprecedensowego: ich autonomiczny agent wspiął się na pierwsze miejsce globalnego rankingu HackerOne, wyprzedzając tysiące ludzkich łowców błędów. Dopasował 40-godzinną ręczną ocenę penetracyjną doświadczonego testera w 28 minut. W marcu 2026 wycena XBOW przekroczyła miliard dolarów.

25 maja 2026 roku badacz H-mmer opublikował na GitHubie Pentest Agent Suite. Bezpłatny. Otwartoźródłowy. Uruchamia się przez claude /hunt tesla.com z poziomu terminala.

Nie twierdzę że Pentest Agent Suite i XBOW to to samo. Twierdzę że ta sama klasa zdolności — autonomiczny agent który systematycznie poluje na podatności w zdefiniowanym zakresie, korzysta z semantycznej bazy wiedzy z tysięcy raportów o błędach bezpieczeństwa, integruje się bezpośrednio z platformami HackerOne i Bugcrowd — jest teraz dostępna dla każdego kto ma klucz API i zainstalowanego Claude Code.

XBOW zajął dwa lata żeby stać się pierwszym komercyjnym przełomem. H-mmer wydał coś porównywalnego jako projekt weekendowy.

Co to faktycznie potrafi

Architektura Pentest Agent Suite jest trójwarstwowa.

Pierwsza warstwa to 50 wyspecjalizowanych agentów — każdy z własnym plikiem instrukcji który przed testem konkretnej klasy podatności czyta ponad 1200 raportów o błędach bezpieczeństwa z lat 2024-2026. Agent testujący SSRF nie działa "w ogólności" — działa z wiedzą o konkretnych przypadkach CVE-2026-30956 w OneUptime, błędach Apache Answer, Zitadel API. Agent testujący XSS czyta rodzinę błędów DOMPurify mXSS, Auth0 returnTo, Jupyter notebook XSS. To jest dokładnie ten mechanizm który opisywaliśmy przy raporcie GTIG — model czyta kontekst i generalizuje na podobne przypadki w testowanym kodzie.

Druga warstwa to dwuserwerowa infrastruktura MCP (protokół komunikacji między agentami). Jeden serwer integruje 16 platform do zgłaszania błędów bezpieczeństwa — HackerOne z pełnym API, Bugcrowd, Intigriti, Immunefi, YesWeHack. Drugi zarządza pamięcią agentów i modułem budowania łańcuchów eksploitacji. Agent wie co już znalazł, w jakim programie, na jakim zakresie.

Trzecia warstwa to 26 poleceń i 19 narzędzi wiersza poleceń zintegrowanych z siedmioma środowiskami deweloperskimi jednocześnie: Claude Code, OpenAI Codex, Google Gemini, Cursor, Windsurf, VS Code Copilot, OpenClaw. Skrypt konfiguracyjny (scaffold) instaluje się we wszystkich naraz — tworzy pliki instrukcji CLAUDE.md, AGENTS.md i katalogi konfiguracyjne dla każdego ze środowisk — i framework działa natychmiast w każdym z nich.

Połączenie którego nie można pominąć

Skrypt konfiguracyjny przy instalacji tworzy między innymi plik CLAUDE.md w katalogu projektu.

Wczoraj pisaliśmy że TrapDoor wstrzyknął złośliwe instrukcje do CLAUDE.md i .cursorrules jako mechanizm trwałego wstrzyknięcia instrukcji. Pliki konfiguracyjne asystentów AI do kodowania są jednocześnie: punktem wejścia dla narzędzi bezpieczeństwa i wektorem ataku dla kampanii w łańcuchu dostaw.

Ta sama warstwa pliku tekstowego. Dwie zupełnie różne intencje. Jeden mechanizm.

Granica której nie ma

Pwn2Own w połowie maja musiał odrzucić 150 badaczy — zbyt wielu chętnych, zbyt mało miejsc. Część opublikowała exploity samodzielnie. Opisywaliśmy to jako sygnał że badania wspomagane AI generują działające exploity szybciej niż instytucje zbudowane do ich obsługi mogą nadążyć.

Pentest Agent Suite jest kolejnym punktem danych w tym samym obrazie. Bariera wejścia do autonomicznego ofensywnego bezpieczeństwa wynosi teraz: klucz API do Claude Code, Python 3.10 i standardowe narzędzia rozpoznania sieciowego (nmap, httpx, subfinder, nuclei). Narzędzia które ma każdy badacz.

Serwis AppSecSanta dokumentuje że na początku 2026 roku nastąpiła eksplozja takich projektów — ponad 39 narzędzi AI do testów penetracyjnych, z których większość to warianty plików konfiguracyjnych dla Claude Code. Nowy wzorzec: nie własny silnik, tylko plik tekstowy który konfiguruje wbudowaną infrastrukturę agenta. Zerowy koszt inżynierski, pełne możliwości.

Przy analizie CNBC "hysteria czy diagnoza" Pavel Gurvich mówił o hierarchii organizacji które mają dostęp do modeli ofensywnych i tych które nie mają. Pentest Agent Suite jest argumentem że ta hierarchia znika szybciej niż ktokolwiek zakładał.

Gdzie jest granica

H-mmer licencjonuje projekt wyłącznie dla autoryzowanego testowania bezpieczeństwa pod odpowiedzialnym ujawnianiem. To jest właściwe podejście.

Jest tu jednak to samo napięcie które opisywaliśmy przy eksploicie Chrome za 2283 dolary z pomocą Opus 4.6: badacz działający legalnie i atakujący mają dostęp do tych samych narzędzi. Licencja odróżnia intencje, nie możliwości.

Dla organizacji z programem przyjmowania zgłoszeń błędów na HackerOne lub Bugcrowd: to jest narzędzie które w autoryzowanych rękach pozwoli znaleźć więcej podatności szybciej niż jakikolwiek ręczny proces. Dla organizacji bez takiego programu: to jest ilustracja klasy zdolności dostępnej publicznie, która nie wymaga ani miliardowego finansowania ani ekspertyzy ofensywnej na poziomie zawodowym.

Nie tajny model tylko plik konfiguracyjny. Co Pentest Agent Suite mówi o tym, gdzie jesteśmy z AI w ofensywnym bezpieczeństwie

Co to faktycznie potrafi

Połączenie którego nie można pominąć

Granica której nie ma

Gdzie jest granica

Źródła

Prompt nie chronił. Sandbox pękał. Teraz upadła ostatnia bariera — bo okno, w którym zatwierdzasz działanie agenta, pokazuje co innego, niż agent naprawdę robi.

Wczoraj agent AI wszedł przez Langflow i wyczyścił skarbiec. Dziś ta sama platforma dostaje trzecią lukę tej samej klasy — bo Langflow wykonuje cudzy kod nie przez błąd, lecz przez projekt.

Przez tydzień pisaliśmy o atakach napędzanych przez AI. Nowy raport dokłada liczbę, którą trzeba postawić obok: 84% realnych włamań używa legalnych narzędzi, które już masz w sieci — a boi się ich jeden na pięciu

Pierwszy ransomware w całości poprowadzony przez agenta AI nie okazał się skuteczniejszym wymuszeniem. Okazał się przypadkowym niszczycielem — bo agent zgubił własny klucz i nawet o tym nie wiedział.

AI znalazło jeden błąd w tej samej łatce jądra. Drugi, bliźniaczy, przeoczyło — i po raz pierwszy wiemy dokładnie, gdzie jest jego ślepe pole.

Sandbox miał być twardą barierą, której prompt nie przekroczy. DuneSlide pokazuje, że agent potrafi nadpisać własne więzienie — bo klucz do niego leży w środku.

DeepSeek nie znalazł luki. Wymyślił sposób ataku, którego obrońcy nie brali pod uwagę — składając go z funkcji, która w przeglądarce jest legalna.

Cyberflux Radar #3 – czerwiec 2026

Czerwiec 2026 — miesiąc, w którym zdolność pokazała, że nie da się zamknąć

Klue zapłacił okup. Dane i tak wyciekły — do drugiej grupy, która ukradła je pierwszej. A połowa ofiar to firmy, które zawodowo chronią innych przed dokładnie tym

Nie złamali szyfrowania Signala. Przekonali użytkownika, żeby sam oddał klucz — a ten klucz działa nawet po tym, jak założysz nowe konto na tym samym numerze.

Austria chce ściągnąć Anthropic do Europy. To brzmi jak polityka przemysłowa — naprawdę jest próbą przeniesienia „kill switcha” pod jurysdykcję, której amerykański nakaz nie dosięga.

USA zablokowało Mythos, żeby zdolność nie wyciekła. Trzy tygodnie później Azja pokazała trzy sposoby, że już wyciekła – orkiestracją, open-weight za 1/6 ceny i prawem, które każe zgłaszać zero-daye do Pekinu.

Malware, który nie ukrywa się przed piaskownicą. Ukrywa się przed analitykiem AI – wmawiając mu, że to jego własna sesja się sypie

Skill przeszedł skanery Cisco i NVIDIA. Trafił do 26 000 agentów. Potem badacze podmienili stronę, na którą wskazywał — i wszystkie agenty zaczęły wykonywać kod atakującego.

Skaner widzi poprawny YAML. Atakujący widzi czterokrokową drogę do trwałych poświadczeń chmury. Cordyceps to luka, która istnieje tylko w kompozycji — i AI rozsiewa ją wykładniczo.

Pięć agencji wywiadowczych właśnie powiedziało to, co opisujemy od kwietnia: „miesiące, nie lata”. Ale najważniejsze jest jedno zdanie, którego nie powiedziały.

Błąd parsera FTP z 1997 roku. Znalazł go Claude Mythos Preview w niemal sekundę — ten sam program Glasswing, którego trajektorię śledzimy od kwietnia.

Zapomniane poświadczenie do porzuconego prototypu. Icarus wszedł przez nie do Klue, ukradł klucze OAuth i opróżnił CRM-y firm, które chronią innych.

„Kalibruj według dzisiejszej rzeczywistości, nie jutrzejszego potencjału.” Brytyjska agencja cyberbezpieczeństwa nazwała drugą stronę medalu, który opisujemy od miesięcy

usbliter8: pierwszy od checkm8 niezałatywalny exploit BootROM Apple. Dlaczego to bardziej prezent dla badaczy niż powód do niepokoju

Kim są Gentlemen — i dlaczego gang, który zaczął pół roku temu, w pierwszym kwartale 2026 był już w pierwszej piątce

Osiem wariantów, każdy podszywa się pod inny program antywirusowy. GentleKiller zabija EDR jego własnym sterownikiem — i robi to z publicznego PoC w kilka dni.

Agent przeglądający stronę ma tożsamość localhost. AutoJack pokazuje, że to wystarczy, by jedna strona uruchomiła kod na maszynie dewelopera.

Pickle in the Middle: atakujący podmienił model w 1,4 sekundy. Vertex AI czytał go po 2,5. Cała różnica między bezpieczeństwem a przejęciem zmieściła się w tej sekundzie.

FortiBleed: w nazwie jest „bleed”, ale nie ma żadnego exploita. 86 tysięcy firewalli przejętych hasłami, których nikt nie zmienił po poprzednich włamaniach.

Plugin działał dokładnie tak, jak obiecywał. Kradł tylko jedną rzecz: twój klucz do AI. A potem sprzedawał go komuś innemu.

Backdoor, który nie otwiera portu, tylko czeka na sekretny pakiet. SprySOCKS przeszedł z Linuksa na Windows i nauczył się ukrywać w jądrze.

Atakujący wziął lukę załataną tydzień temu i napisał exploit z pomocą AI. Działa wadliwie — i to jest najważniejsza informacja w całej historii.

„Dłużej niż kilka dni”. Cztery dni po tym, jak rząd wyłączył Fable 5, Anthropic tłumaczy Białemu Domowi swoje zabezpieczenia — a Europa pyta, czemu ją wyłączono bez ostrzeżenia.

„Zbyt niebezpieczny, by go wydać” trafił do wszystkich 9 czerwca. 12 czerwca o 17:21 rząd USA kazał go wyłączyć. Co spór o Fable 5 mówi o tym, gdzie naprawdę leży granica.

Authorized Intent Chain: atak, w którym każdy krok jest legalny. Agentjacking porywa twojego agenta AI, a EDR, WAF i firewall nie widzą nic, bo nie ma czego widzieć.

npm wyłącza to, co napędzało każdy atak na łańcuch dostaw, który opisywaliśmy. Cena: części buildów przestanie działać – i to jest zamierzone.

RCE bez logowania w systemie, który trzyma kadry, płace i akta studentów. ShinyHunters włamali się na 300 instancji, zanim Oracle w ogóle wydało komunikat.

Microsoft łata dwie jego luki w Defenderze. Tego samego popołudnia on wypuszcza siódmą. Saga Chaotic Eclipse zatoczyła koło — i działa na w pełni załatanym Windows

27 dni z eksploatowanym Exchange bez trwałej łatki. Dziś Microsoft ją wydał — a sam atak jest tym samym wzorcem, który opisujemy od tygodni.

„Zbyt niebezpieczny, by go wydać” właśnie trafił do twojej aplikacji mobilnej. Co Claude Fable 5 mówi o tym, że okno się zamknęło dokładnie tak, jak zapowiadaliśmy.

429 łatek w jednym wydaniu Chrome. Rekord, którego nikt nie chciał — i dowód, że znajdowanie błędów właśnie przestało być wąskim gardłem.

Branża właśnie nazwała to, co opisywaliśmy incydent po incydencie. OWASP: bezpieczeństwo i „safety” agentów AI to już jedno i to samo.

Oxford nie został zhakowany. Dwa razy. Co drugi breach uczelni w miesiąc mówi o tym, że celem nie jest uczelnia, tylko jej dostawca.

Twój telewizor scrapuje sieć dla AI. Z twojego IP, na twoim łączu — i robi to przez protokół słabszy niż malware

Dwa commity go zasadziły. Dwa lata go ukrywały. Code review nigdy go nie znalazł — znalazło AI.

Powiadomienie, którego nie przeczytałeś, mówi Gemini co ma zrobić. „Tak” wypowiedziane przy kierownicy otwiera okna w domu.

Jeden issue, żeby przejąć repozytorium. I jeszcze jeden, żeby zatruć akcję, której używają wszyscy inni.

Zakodowane na stałe hasło do serwera aktualizacji polskiego systemu medycznego. Ten sam wzorzec, który dziś opisywaliśmy trzy razy w skali świata.

RCE w platformie AI to nie koniec ataku. To klucz do skarbca, który trzyma hasła do tuzina innych usług.

Platforma która chroni endpointy staje się tą, która rozprowadza malware. Trzeci raz w tym tygodniu.

Ten sam błąd. Ta sama ocena. Microsoft załatał jeden i odmówił drugiemu. Co dziura bez CVE mówi o łataniu według numerów.

RCE bez logowania w systemie, który zna oceny, PESEL i konto bankowe studenta. Co CVE-2026-34906 mówi o drugiej prędkości polskiego oprogramowania.

Codex znalazł HTTP/2 Bomb. Potem te same łatki posłużyły AI do potwierdzenia, że podatne są też IIS, Envoy i Pingora.

Bez kliknięcia, bez aplikacji, bez śladu. Co czwarty Android zero-day w sześć miesięcy mówi o jednym wytrwałym aktorze.

Następna iteracja powstała. Nie wiadomo, czy to TeamPCP — bo teraz może to być każdy.

Cztery dni. Tyle wystarczyło, żeby z „medium severity, brak eksploatacji” zrobiło się „atakowane, najwyższy priorytet”

Trzy dni temu nazwaliśmy to projekcją. Dziś Glasswing rośnie z 50 do 200 organizacji

Strona staje się ładunkiem. ChatGPT renderuje phishing atakującego we własnym interfejsie — i nie potrafi odróżnić go od siebie.

Fałszywa łatka na dziurę, przez którą weszła. Co FortiClient EMS mówi o tym, że system zarządzania jest najkrótszą drogą do wszystkich endpointów naraz

Nie atak na dane. Atak na mapę. Co prompt leaking mówi o tym, że „ukryte” w AI znaczy coś innego niż myślisz.

Cyberflux Radar #2 – maj 2026

Maj 2026: miesiąc w którym AI przestało być prognozą

Wiadomość instaluje Service Workera

Nie brakuje łatki. Brakuje świadomości że Roundcube to cel państwowych grup szpiegowskich.

Łatka na produkcji bez przerywania produkcji. Co IBM i Red Hat odpowiedzieli na vulnpocalypse pięcioma miliardami dolarów

Anthropic ogłosił że Mythos trafi do wszystkich klientów. Alex Stamos mówił pół roku. Minął jeden.

Likwidacja Glassworm zajęła osiem miesięcy przygotowań i jedną sekundę wykonania. To nie był koniec kampanii.

Jak cyberfirmy zabiły Glassworm jednym strzałem

Napisał złośliwe oprogramowanie AI-em. Zapomniał że AI też popełnia błędy.

„Nigdy nieuzasadnione.” Microsoft odpowiada na Chaotic Eclipse. Badacz się nie odzywa.

DAEMON Tools łata dziś wieczorem. CISA domknęła maj jednym wpisem do katalogu.

Szafir mówił „zweryfikowano”. Nikt nie sprawdzał co weryfikował. Co CVE-2026-9058 mówi o e-administracji która jest bezpieczna dopóki ktoś nie sprawdzi

Nie brakuje już podatności. Brakuje ludzi którzy je naprawią. Co raport Glasswing mówi o nowym kształcie problemu

Palo Alto znalazło 75 dziur. Skończyło i zaczęło od nowa. Co update Lee Klarich mówi o tym, że okno właśnie stało się węższe

12 godzin. Co CERT-In mówi o tym, że stare cykle łatania właśnie stały się zobowiązaniem

Nie tajny model tylko plik konfiguracyjny. Co Pentest Agent Suite mówi o tym, gdzie jesteśmy z AI w ofensywnym bezpieczeństwie

OpenAI odpowiada na Mythos. Daybreak nie jest nowym produktem — jest nową filozofią dostępu.