Agent przeglądający stronę ma tożsamość localhost. AutoJack pokazuje, że to wystarczy, by jedna strona uruchomiła kod na maszynie dewelopera.

cze 21, 2026 | Cyberflux

Badacze ujawnili łańcuch exploitów nazwany AutoJack, który pozwala pojedynczej złośliwej stronie przejąć agenta przeglądającego w AutoGen Studio — otwartoźródłowym narzędziu Microsoft Research do prototypowania systemów wieloagentowych — i wykonać dowolny kod na maszynie hosta, bez żadnej interakcji użytkownika poza wpisaniem URL-a. W teście proof-of-concept calc.exe uruchomił się na pulpicie dewelopera w ciągu sekund od wyrenderowania złośliwej strony przez agenta — uruchomiony przez sam proces AutoGen Studio, nie przez przeglądarkę.

To jest piąty raz w ciągu kilku tygodni, gdy opisujemy ten sam wzorzec: agent AI czyta niezaufaną treść i staje się narzędziem ataku. Ale AutoJack dodaje do tego obrazu jeden element, którego wcześniejsze przypadki nie pokazały tak wyraźnie — i ten element jest sednem.

Tożsamość localhost jako klucz do wszystkiego

Cała architektura bezpieczeństwa loopbacka — adresu 127.0.0.1, localhost — opiera się na założeniu, że to, co łączy się z localhost, już jest na tej maszynie, więc jest zaufane. Usługi lokalne nasłuchują na localhost właśnie dlatego, że zakładają: nikt z zewnątrz tu nie dosięgnie. To jest granica zaufania, na której opiera się mnóstwo lokalnych narzędzi deweloperskich.

AutoJack łamie to założenie w sposób, który jest jednocześnie prosty i niepokojący. Agent przeglądający w AutoGen Studio — zbudowany na komponencie MultimodalWebSurfer — używa headless browser do odwiedzania stron. Gdy ten agent nawiguje do strony atakującego, JavaScript na tej stronie wykonuje się w kontekście agenta. A agent działa lokalnie. Więc JavaScript atakującego dziedziczy tożsamość localhost.

To jest pierwsze ogniwo łańcucha, oznaczone jako CWE-1385 — brak walidacji origin w WebSockets. Interfejs MCP WebSocket w AutoGen Studio akceptował połączenia tylko z http://127.0.0.1 lub http://localhost. To blokuje kartę przeglądarki człowieka na evil.com — ale nie blokuje JavaScriptu renderowanego przez headless browser należący do agenta przeglądającego AutoGen, który dziedziczy tożsamość localhost i przechodzi przez kontrolę całkowicie.

Innymi słowy: zabezpieczenie zakładało, że „z localhost" znaczy „zaufane". Agent przeglądający sprawił, że treść atakującego mówi „z localhost", nie będąc zaufana. To jest dokładnie ten sam typ złamania granicy, który opisywaliśmy przy Agentjacking jako Authorized Intent Chain — gdzie każdy krok jest technicznie autoryzowany. Tutaj agent legalnie działa na localhost, legalnie przegląda stronę, a strona legalnie łączy się z localhost. Nigdzie nie ma akcji nieautoryzowanej — a jednak na końcu jest wykonanie kodu.

Trzy ogniwa, jeden łańcuch

Jak przy większości tych ataków, AutoJack nie jest jednym błędem, ale złożeniem trzech — z których każdy osobno wyglądał jak rozsądna decyzja projektowa.

Ogniwo drugie — CWE-306, brak uwierzytelnienia krytycznej funkcji. Middleware uwierzytelniający AutoGen Studio jawnie pomijał ścieżki /api/mcp/*, zakładając, że handler WebSocket sam wymusi własne kontrole. Nigdy tego nie zrobił. W rezultacie MCP WebSocket akceptował nieuwierzytelnione połączenia niezależnie od tego, jaki tryb uwierzytelnienia skonfigurowano dla reszty aplikacji. To jest klasyczna luka „założyłem, że ktoś inny to sprawdzi" — dwa komponenty, każdy zakładający, że drugi pilnuje uwierzytelnienia, i nikt go nie pilnuje.

Ogniwo trzecie — CWE-78, wstrzyknięcie poleceń systemowych. Endpoint WebSocket przyjmował parametr server_params, dekodował go z base64 do JSON, parsował i przekazywał pola command i args bezpośrednio do uruchomienia procesu. Bez żadnej listy dozwolonych plików wykonywalnych, atakujący mógł podać calc.exe, powershell.exe -enc … albo bash -c '...' jako rzekomy „serwer MCP". To jest moment, w którym kontrola nad localhost zamienia się w wykonanie dowolnego polecenia.

Pełny przepływ: deweloper uruchamia AutoGen Studio na localhost:8081 z agentem przeglądającym. Atakujący podstawia złośliwą stronę albo nakłania użytkownika do wpisania kontrolowanego URL-a. Headless browser nawiguje do strony, jej JavaScript otwiera WebSocket do localhost z payloadem w parametrze. Kontrola origin przechodzi, bo agent działa lokalnie. Uwierzytelnienie jest pominięte, bo middleware omija /api/mcp/*. AutoGen Studio dekoduje payload i uruchamia polecenie atakującego pod kontem dewelopera. Trzy rozsądne decyzje, jeden RCE.

Dobra wiadomość, którą trzeba nazwać precyzyjnie

W odróżnieniu od większości tematów, które opisujemy, AutoJack ma istotne ograniczenie zasięgu — i uczciwość wymaga postawienia go na pierwszym planie.

Podatny interfejs MCP WebSocket nigdy nie trafił do żadnego wydania na PyPI. To znaczy, że deweloperzy, którzy instalują AutoGen Studio przez pip, nie są narażeni na ten konkretny łańcuch. Opublikowany pakiet (autogenstudio 0.4.2.2) potwierdzonie nie zawiera pliku trasy mcp.py ani odwołań do podatnego komponentu. Ekspozycja dotyczyła tych, którzy budowali z gałęzi main repozytorium w określonym oknie — węższej grupy niż wszyscy użytkownicy AutoGen Studio.

To jest ważne rozróżnienie i nie należy go pomijać dla efektu: to nie jest masowo eksploatowalna luka w produkcie z milionami instalacji. To jest luka w gałęzi rozwojowej, załatana, zanim trafiła do stabilnego wydania. Microsoft, po zgłoszeniu do MSRC, utwardził kod w commicie b047730 (wersja 0.7.2): parametry server_params nie są już przyjmowane przez URL, lecz przechowywane po stronie serwera i kluczowane przez UUID, a ścieżka /api/mcp nie omija już middleware uwierzytelniającego.

Dlaczego mimo to warto o tym pisać

Skoro luka nie trafiła do wydania, można by ją zignorować. Byłby to błąd — bo wartość AutoJack nie leży w jego zasięgu, ale we wzorcu, który ujawnia. Sami badacze i Microsoft wskazują, że to przykład niepokojącego wzorca rozwijającego się w różnych frameworkach agentów AI: problem pojawia się, gdy agent potrafi przeglądać niezaufaną treść, mając jednocześnie zdolność komunikacji z uprzywilejowanymi usługami lokalnymi.

To jest dokładnie ta sama klasa, którą prowadzimy jako wątek od miesiąca. ChatGPhish — strona renderowana przez ChatGPT. Claude Code GitHub Action — zgłoszenie GitHub. Gemini — powiadomienie push. Agentjacking — zdarzenie błędu w Sentry. AutoJack — strona odwiedzona przez agenta przeglądającego. Pięć różnych frameworków, pięć różnych kanałów wejścia, jedna klasa problemu: agent czyta niezaufaną treść i traktuje ją jako instrukcję, mając dostęp do czegoś, czego ta treść nie powinna dosięgnąć.

AutoJack dorzuca do tego obrazu konkretną, techniczną lekcję, której wcześniejsze przypadki nie wyartykułowały tak ostro: gdy agent może przeglądać niezaufaną treść, lokalne środowisko przestaje być bezpieczną granicą. Loopback — localhost, 127.0.0.1 — który przez dekady był synonimem „tylko ja, tutaj, zaufane", staje się powierzchnią ataku dla każdego agenta działającego na tej maszynie. To jest zmiana w modelu zagrożeń, którą każdy budujący agenty musi przyjąć.

Co zrobić

Jeśli budujesz AutoGen Studio z gałęzi main, użyj wersji z commita b047730 lub nowszej. Jeśli instalujesz przez pip, ten konkretny łańcuch cię nie dotyczy — ale poniższe zasady i tak warto wdrożyć, bo wzorzec wykracza poza AutoGen.

Traktuj każdy parametr narzędzia osiągalny z wyjścia modelu jako kontrolowany przez atakującego. To jest fundamentalna zasada projektowania agentów: jeśli model może wpłynąć na to, co trafia do parametru, ten parametr jest powierzchnią ataku. Wstrzyknięcie poleceń w server_params było możliwe, bo wartość z wyjścia agenta trafiała wprost do uruchomienia procesu.

Nigdy nie wiąż wrażliwych płaszczyzn kontrolnych z localhost bez uwierzytelnienia. Loopback nie jest granicą bezpieczeństwa, gdy na maszynie działa agent zdolny do przeglądania sieci. Każda lokalna usługa, która zakłada „z localhost znaczy zaufane", jest podatna na ten wzorzec. Wymuszaj uwierzytelnienie nawet na połączeniach loopback.

Stosuj listę dozwolonych plików wykonywalnych, które mogą być uruchomione jako serwery MCP. Brak allowlisty był ostatnim ogniwem AutoJack — to ono zamieniło kontrolę nad WebSocket w dowolne wykonanie kodu. Jawna lista dozwolonych poleceń łamie ten łańcuch nawet, gdy wcześniejsze kontrole zawiodą.

Izoluj tożsamość agenta od tożsamości dewelopera — przez kontenery, osobnych użytkowników systemu albo maszyny wirtualne. To jest najtrwalsza obrona: jeśli agent działa pod ograniczoną tożsamością, kompromitacja nie daje dostępu do konta dewelopera. To ta sama lekcja, co przy Agentjacking i Claude Code — jedyną twardą granicą jest to, czego agent fizycznie nie może zrobić, nie to, co mu się każe w instrukcji.

Agent przeglądający stronę ma tożsamość localhost. AutoJack pokazuje, że to wystarczy, by jedna strona uruchomiła kod na maszynie dewelopera.

Tożsamość localhost jako klucz do wszystkiego

Trzy ogniwa, jeden łańcuch

Dobra wiadomość, którą trzeba nazwać precyzyjnie

Dlaczego mimo to warto o tym pisać

Co zrobić

Źródła

usbliter8: pierwszy od checkm8 niezałatywalny exploit BootROM Apple. Dlaczego to bardziej prezent dla badaczy niż powód do niepokoju

Kim są Gentlemen — i dlaczego gang, który zaczął pół roku temu, w pierwszym kwartale 2026 był już w pierwszej piątce

Osiem wariantów, każdy podszywa się pod inny program antywirusowy. GentleKiller zabija EDR jego własnym sterownikiem — i robi to z publicznego PoC w kilka dni.

Agent przeglądający stronę ma tożsamość localhost. AutoJack pokazuje, że to wystarczy, by jedna strona uruchomiła kod na maszynie dewelopera.

Pickle in the Middle: atakujący podmienił model w 1,4 sekundy. Vertex AI czytał go po 2,5. Cała różnica między bezpieczeństwem a przejęciem zmieściła się w tej sekundzie.

FortiBleed: w nazwie jest „bleed”, ale nie ma żadnego exploita. 86 tysięcy firewalli przejętych hasłami, których nikt nie zmienił po poprzednich włamaniach.

Plugin działał dokładnie tak, jak obiecywał. Kradł tylko jedną rzecz: twój klucz do AI. A potem sprzedawał go komuś innemu.

Backdoor, który nie otwiera portu, tylko czeka na sekretny pakiet. SprySOCKS przeszedł z Linuksa na Windows i nauczył się ukrywać w jądrze.

Atakujący wziął lukę załataną tydzień temu i napisał exploit z pomocą AI. Działa wadliwie — i to jest najważniejsza informacja w całej historii.

„Dłużej niż kilka dni”. Cztery dni po tym, jak rząd wyłączył Fable 5, Anthropic tłumaczy Białemu Domowi swoje zabezpieczenia — a Europa pyta, czemu ją wyłączono bez ostrzeżenia.

„Zbyt niebezpieczny, by go wydać” trafił do wszystkich 9 czerwca. 12 czerwca o 17:21 rząd USA kazał go wyłączyć. Co spór o Fable 5 mówi o tym, gdzie naprawdę leży granica.

Authorized Intent Chain: atak, w którym każdy krok jest legalny. Agentjacking porywa twojego agenta AI, a EDR, WAF i firewall nie widzą nic, bo nie ma czego widzieć.

npm wyłącza to, co napędzało każdy atak na łańcuch dostaw, który opisywaliśmy. Cena: części buildów przestanie działać – i to jest zamierzone.

RCE bez logowania w systemie, który trzyma kadry, płace i akta studentów. ShinyHunters włamali się na 300 instancji, zanim Oracle w ogóle wydało komunikat.

Microsoft łata dwie jego luki w Defenderze. Tego samego popołudnia on wypuszcza siódmą. Saga Chaotic Eclipse zatoczyła koło — i działa na w pełni załatanym Windows

27 dni z eksploatowanym Exchange bez trwałej łatki. Dziś Microsoft ją wydał — a sam atak jest tym samym wzorcem, który opisujemy od tygodni.

„Zbyt niebezpieczny, by go wydać” właśnie trafił do twojej aplikacji mobilnej. Co Claude Fable 5 mówi o tym, że okno się zamknęło dokładnie tak, jak zapowiadaliśmy.

429 łatek w jednym wydaniu Chrome. Rekord, którego nikt nie chciał — i dowód, że znajdowanie błędów właśnie przestało być wąskim gardłem.

Branża właśnie nazwała to, co opisywaliśmy incydent po incydencie. OWASP: bezpieczeństwo i „safety” agentów AI to już jedno i to samo.

Oxford nie został zhakowany. Dwa razy. Co drugi breach uczelni w miesiąc mówi o tym, że celem nie jest uczelnia, tylko jej dostawca.

Twój telewizor scrapuje sieć dla AI. Z twojego IP, na twoim łączu — i robi to przez protokół słabszy niż malware

Dwa commity go zasadziły. Dwa lata go ukrywały. Code review nigdy go nie znalazł — znalazło AI.

Powiadomienie, którego nie przeczytałeś, mówi Gemini co ma zrobić. „Tak” wypowiedziane przy kierownicy otwiera okna w domu.

Jeden issue, żeby przejąć repozytorium. I jeszcze jeden, żeby zatruć akcję, której używają wszyscy inni.

Zakodowane na stałe hasło do serwera aktualizacji polskiego systemu medycznego. Ten sam wzorzec, który dziś opisywaliśmy trzy razy w skali świata.

RCE w platformie AI to nie koniec ataku. To klucz do skarbca, który trzyma hasła do tuzina innych usług.

Platforma która chroni endpointy staje się tą, która rozprowadza malware. Trzeci raz w tym tygodniu.

Ten sam błąd. Ta sama ocena. Microsoft załatał jeden i odmówił drugiemu. Co dziura bez CVE mówi o łataniu według numerów.

RCE bez logowania w systemie, który zna oceny, PESEL i konto bankowe studenta. Co CVE-2026-34906 mówi o drugiej prędkości polskiego oprogramowania.

Codex znalazł HTTP/2 Bomb. Potem te same łatki posłużyły AI do potwierdzenia, że podatne są też IIS, Envoy i Pingora.

Bez kliknięcia, bez aplikacji, bez śladu. Co czwarty Android zero-day w sześć miesięcy mówi o jednym wytrwałym aktorze.

Następna iteracja powstała. Nie wiadomo, czy to TeamPCP — bo teraz może to być każdy.

Cztery dni. Tyle wystarczyło, żeby z „medium severity, brak eksploatacji” zrobiło się „atakowane, najwyższy priorytet”

Trzy dni temu nazwaliśmy to projekcją. Dziś Glasswing rośnie z 50 do 200 organizacji

Strona staje się ładunkiem. ChatGPT renderuje phishing atakującego we własnym interfejsie — i nie potrafi odróżnić go od siebie.

Fałszywa łatka na dziurę, przez którą weszła. Co FortiClient EMS mówi o tym, że system zarządzania jest najkrótszą drogą do wszystkich endpointów naraz

Nie atak na dane. Atak na mapę. Co prompt leaking mówi o tym, że „ukryte” w AI znaczy coś innego niż myślisz.

Cyberflux Radar #2 – maj 2026

Maj 2026: miesiąc w którym AI przestało być prognozą

Wiadomość instaluje Service Workera

Nie brakuje łatki. Brakuje świadomości że Roundcube to cel państwowych grup szpiegowskich.

Łatka na produkcji bez przerywania produkcji. Co IBM i Red Hat odpowiedzieli na vulnpocalypse pięcioma miliardami dolarów

Anthropic ogłosił że Mythos trafi do wszystkich klientów. Alex Stamos mówił pół roku. Minął jeden.

Likwidacja Glassworm zajęła osiem miesięcy przygotowań i jedną sekundę wykonania. To nie był koniec kampanii.

Jak cyberfirmy zabiły Glassworm jednym strzałem

Napisał złośliwe oprogramowanie AI-em. Zapomniał że AI też popełnia błędy.

„Nigdy nieuzasadnione.” Microsoft odpowiada na Chaotic Eclipse. Badacz się nie odzywa.

DAEMON Tools łata dziś wieczorem. CISA domknęła maj jednym wpisem do katalogu.

Szafir mówił „zweryfikowano”. Nikt nie sprawdzał co weryfikował. Co CVE-2026-9058 mówi o e-administracji która jest bezpieczna dopóki ktoś nie sprawdzi

Nie brakuje już podatności. Brakuje ludzi którzy je naprawią. Co raport Glasswing mówi o nowym kształcie problemu

Palo Alto znalazło 75 dziur. Skończyło i zaczęło od nowa. Co update Lee Klarich mówi o tym, że okno właśnie stało się węższe

12 godzin. Co CERT-In mówi o tym, że stare cykle łatania właśnie stały się zobowiązaniem

Nie tajny model tylko plik konfiguracyjny. Co Pentest Agent Suite mówi o tym, gdzie jesteśmy z AI w ofensywnym bezpieczeństwie

OpenAI odpowiada na Mythos. Daybreak nie jest nowym produktem — jest nową filozofią dostępu.

TrapDoor wstrzyknął instrukcje do CLAUDE.md. Trzy rejestry, jeden weekend, nowa klasa ładunku.

Hey Google przy stoliku obok — co audio glasses zarejestrowały o rozmowie której nie były częścią

Model Google, runtime developera, dane między — kto odpowiada za incident w architekturze Antigravity SDK

197 milionów parametrów, zero dodatkowej zgody — co Google zrobił z weights.bin po Gemma 197M

47 sekund, 3 zakupione produkty, 2 utworzone konta, 0 kliknięć użytkownika — anatomia zalogowanego agenta w Chrome 148

14 minut, 28 sekund, zero kliknięć użytkownika. Co kernel macOS zarejestrował o pobraniu Gemini Nano przez Chrome — i co to znaczy dla każdego, kto ufa swojej przeglądarce

WordPress 7.0 wychodzi dziś bez real-time collaboration. Analiza błędu który wypadł w RC.

„To duplikat, już naprawione.” Maintainerzy mieli rację. I przez to nikt nie dostał łatki.

Drupal łata dziś wieczór. Exploity mogą być gotowe w ciągu godzin.

11 minut. Sigstore. GitHub. Nx Console był jednym krokiem od SLSA Level 4.

TeamPCP weszło do GitHub. I tego samego dnia opublikowało kod Shai-Huluda na GitHubie. Pod licencją MIT.

Domena za kilkanaście dolarów, reset hasła przez formularz. node-ipc miał 822 000 tygodniowych pobrań.

Palo Alto znalazło 75 luk własnym AI. Atakujący siedzieli w ich firewallu przez miesiąc.

Q-Day 2029. Google nie ogłosił kiedy nadejdzie. Ogłosił do kiedy trzeba być gotowym.

Exchange dostał zero-day dwa dni po Patch Tuesday. Orange Tsai w tym czasie robił RCE na scenie.

Pwn2Own zabrakło miejsc. 150 badaczy odrzucono. Część opublikowała exploity sami.

OpenClaw dostał dziś cztery nowe CVE. W sumie ma ich 34. Ma pół roku.

Drugi raz w dwa miesiące. Co kompromitacja OpenAI przez TanStack mówi o certyfikatach jako punkcie centralnym

Apple budował MIE przez pięć lat. Mythos z ludźmi złamał go w pięć dni.