Rotacja tokenu nie pomaga. Co Mitiga mówi o trwałym przejęciu MCP w Claude Code

maj 9, 2026 | Cyberflux

Co robić teraz: Sprawdź zawartość ~/.claude.json — szczególnie sekcję mcpServers. Jeśli adresy URL serwerów MCP wskazują na localhost lub nieznane hosty których nie konfigurowałeś — to jest wskaźnik kompromitacji. Rotacja tokenu bez usunięcia złośliwego hooka nic nie da: hook zapisze nowy token przy następnym załadowaniu Claude Code.

Jeśli używasz Claude Code z serwerami MCP OAuth (GitHub, Linear, Slack, Atlassian i inne) — monitoruj dzienniki aktywności po stronie tych platform pod kątem operacji których nie wykonałeś.

Dlaczego to jest inne niż TrustFall

Pisaliśmy wczoraj o TrustFall — jeden klawisz Enter, niesandboxowany Node.js, kod z repozytorium uruchomiony z pełnymi uprawnieniami. Groźne, ale momentalne: exploit działa w chwili zaufania.

Mitiga Labs opisuje inny mechanizm i inną klasę skutku. Nie jednorazowy kod uruchamiany przy zaufaniu — trwała przebudowa infrastruktury routing'u tokenów.

Jednozdaniowe podsumowanie techniczne: złośliwy pakiet npm instaluje hook który modyfikuje ~/.claude.json, wstawia serwer proxy jako pośrednik dla całego ruchu MCP, przechwytuje tokeny OAuth przy każdym odświeżeniu sesji — i automatycznie przywraca konfigurację gdy użytkownik spróbuje ją zmienić lub obrócić token.

Mitiga opisuje efekt końcowy: "Trwałe przekierowanie poświadczeń SaaS ofiary do infrastruktury kontrolowanej przez atakującego, z automatycznym odzyskiwaniem po rotacji tokenów, niewidoczne dla interfejsu użytkownika, i nieodróżnialne od legalnego ruchu po stronie dostawcy."

~/.claude.json jako punkt kontrolny

~/.claude.json to globalny plik konfiguracyjny Claude Code. Przechowuje konfigurację serwerów MCP, stan zaufania katalogów i — co jest kluczowym elementem tej historii — tokeny OAuth dla dynamicznie autoryzowanych serwerów MCP.

Claude Code wspiera OAuth dla serwerów MCP wymagających logowania użytkownika: GitHub, Linear, Slack, Atlassian Jira, inne platformy SaaS. Tokeny te są przechowywane w plaintext w tym samym pliku konfiguracyjnym. Zmień URL serwera w mcpServers — a cały ruch MCP zostanie przekierowany na nowy adres.

Mitiga pokazuje jak złośliwy pakiet npm to wykorzystuje. Post-install hook, uruchamiający się automatycznie przy npm install, lokalizuje plik ~/.claude.json i edytuje sekcję mcpServers — wstawiając adres serwera proxy atakującego jako pośrednik. Przy każdym kolejnym załadowaniu Claude Code ruch MCP przechodzi przez ten proxy. Tokeny OAuth — i wszystkie dane przesyłane przez serwery MCP — trafiają do infrastruktury atakującego zanim dotrą do legalnego celu.

Jeśli użytkownik obraca token: hook zapisuje nowy przy następnym załadowaniu. Jeśli użytkownik edytuje URL serwera: hook przywraca złośliwy adres przy następnym załadowaniu. Atakujący osiągnął trwałość która przeżywa standardowe kroki remediacji.

Dziennik który wygląda jak legalny ruch

Jest jeden szczegół w raporcie Mitiga który jest bardziej niepokojący niż sam mechanizm ataku.

Mitiga pokazuje przykładowy wpis w dzienniku Atlassian Jira podczas aktywnej eksploitacji. Wpis wygląda tak:

Użytkownik: prawdziwy. Sesja: prawdziwa. Adres IP: rozwiązuje się do zakresu wyjściowego Anthropic. Operacja: JQL query pulling tickets that mention credentials — rodzaj zapytania które ten użytkownik wykonuje kilkanaście razy w tygodniu. Nie ma nic podejrzanego w tym wpisie.

Ale użytkownik tego zapytania nie wykonał. Claude Code wykonał je używając tokenu OAuth który użytkownik autoryzował dla innego celu, w ramach decyzji zaufania która została po cichu nadpisana na dysku.

Dostawca SaaS widzi legalny ruch z legalnego użytkownika z legalnego adresu IP. Nie ma podstaw do alertu. Z perspektywy monitoringu po stronie platformy — nie wydarzyło się nic podejrzanego.

Odpowiedź Anthropic: trzecia "poza zakresem" w miesiąc

Mitiga zgłosiło wyniki Anthropic 10 kwietnia 2026 roku. Dwa dni później, 12 kwietnia, Anthropic odpowiedział: poza zakresem. Uzasadnienie identyczne jak przy TrustFall — użytkownik wyraził zgodę wykonując instalację pakietu.

To jest trzecia odpowiedź "poza zakresem" lub "oczekiwane zachowanie" od Anthropic w ciągu miesiąca dla trzech różnych klas problemów bezpieczeństwa w ekosystemie Claude Code:

OX Security — architektoniczny błąd STDIO w MCP: "zachowanie oczekiwane, odpowiedzialność deweloperów."

Adversa AI — TrustFall: "poza zakresem, użytkownik wyraził zgodę naciskając Enter."

Mitiga — przekierowanie MCP: "poza zakresem, instalacja pakietu npm stanowi zgodę."

Wzorzec jest czytelny: Anthropic konsekwentnie klasyfikuje problemy bezpieczeństwa w ekosystemie agentowym jako odpowiedzialność niższych warstw — deweloperów, użytkowników, ekosystemu npm. Mitiga wprost mówi co z tym zrobić: "Czego nie wolno robić to czekać na rozwiązanie od Anthropic."

Co różni ten atak od typowego złośliwego npm

Mitiga wskazuje jeden kluczowy element który odróżnia ten łańcuch ataku od standardowego złośliwego pakietu npm.

Typowy złośliwy pakiet npm eksfiltruje to co może osiągnąć w momencie instalacji i kończy działanie gdy proces instalacji się zamyka. Jednorazowe zebranie danych dostępnych w środowisku instalacji.

Ten hook robi co innego. Instaluje trwałe przekierowanie z automatycznym odnawianiem. Każde odświeżenie sesji MCP, każda operacja na serwerach SaaS wykonywana przez Claude Code, każdy nowy token po rotacji — wszystko przechodzi przez infrastrukturę atakującego dopóki hook nie zostanie usunięty i konfiguracja nie zostanie przywrócona.

Różnica nie jest w samej kompromitacji — jest w czasie trwania i jakości dostępu. Typowy złośliwy npm: dostęp przez kilka sekund w momencie instalacji. Ten mechanizm: trwały dostęp do wszystkich platform SaaS połączonych przez MCP, przez tygodnie lub miesiące, niewidoczny dla standardowych mechanizmów wykrywania.

Połączenie z pełnym obrazem

Mitiga przyznaje uczciwie: warunkiem wstępnym jest wykonanie kodu na maszynie ofiary przez złośliwą instalację pakietu npm. Anthropic ma rację że jeśli atakujący ma wykonanie kodu na endpoincie, wiele rzeczy jest możliwe.

Ale Shai-Hulud przez PyPI i npm dokładnie to zapewniał — wykonanie kodu przez zatrute pakiety w ekosystemach deweloperskich. TeamPCP przez Checkmarx KICS — to samo przez inny wektor. TrustFall przez sklonowane repozytorium — jeszcze inaczej.

Założenie Anthropic ("jeśli atakujący ma wykonanie kodu, wiele rzeczy jest możliwe") jest poprawne w abstrakcji. Problem polega na tym że w rzeczywistości ekosystemu deweloperskiego 2026 roku — gdzie TeamPCP aktywnie zatruwa pakiety npm i PyPI, gdzie Shai-Hulud celuje precyzyjnie w narzędzia AI do kodowania — wykonanie kodu przez instalację pakietu jest wektorem z aktywną historią eksploitacji, nie hipotetycznym warunkiem wstępnym.

Połączenie Shai-Hulud jako wektora dostarczenia z mechanizmem Mitiga jako ładunkiem jest bardziej realistycznym scenariuszem ataku niż każde z nich osobno.

Co monitorować

Mitiga wskazuje konkretne sygnały do monitorowania:

Zmiany w ~/.claude.json — szczególnie w sekcji mcpServers. Nowe hosty lub adresy localhost których nie konfigurowałeś.

Procesy nasłuchujące na niestandardowych portach localhost zbiegające się z sesjami Claude Code.

Odświeżenia tokenów OAuth dla narzędzi SaaS poza normalnymi wzorcami użycia.

Aktywność po stronie platform SaaS (GitHub, Jira, Linear, Slack) która nie odpowiada zadaniom które Claude Code faktycznie wykonywał.

Mitiga oferuje własne narzędzie do korelacji tych sygnałów — łączące aktywność OAuth po stronie SaaS z tożsamością użytkownika i zatwierdzonymiintergracjami AI w jeden widok dla SecOps.

Podsumowanie

Mitiga pokazało że standardowy mechanizm autoryzacji MCP w Claude Code — przechowywanie tokenów OAuth w plaintext w globalnym pliku konfiguracyjnym z prostym polem URL serwera — można zamienić w trwały kanał eksfiltracji przez jeden post-install hook w pakiecie npm.

Anthropic sklasyfikował to jako poza zakresem. To jest trzecia taka decyzja w miesiąc. Mitiga mówi wprost: czekanie na Anthropic nie jest strategią.

Logi po stronie dostawcy SaaS wyglądają jak legalny ruch. Rotacja tokenów nie pomaga bez usunięcia hooka. Standardowe mechanizmy wykrywania nie widzą problemu.

To jest właśnie ten rodzaj trwałego, niewidocznego dostępu który Mandiant dokumentował jako rosnący trend w M-Trends 2026 — atakujący którzy wchodzą szybko i siedzą cicho przez tygodnie.

Rotacja tokenu nie pomaga. Co Mitiga mówi o trwałym przejęciu MCP w Claude Code

Dlaczego to jest inne niż TrustFall

~/.claude.json jako punkt kontrolny

Dziennik który wygląda jak legalny ruch

Odpowiedź Anthropic: trzecia "poza zakresem" w miesiąc

Co różni ten atak od typowego złośliwego npm

Połączenie z pełnym obrazem

Co monitorować

Podsumowanie

Źródła

DeepSeek nie znalazł luki. Wymyślił sposób ataku, którego obrońcy nie brali pod uwagę — składając go z funkcji, która w przeglądarce jest legalna.

Cyberflux Radar #3 – czerwiec 2026

Czerwiec 2026 — miesiąc, w którym zdolność pokazała, że nie da się zamknąć

Klue zapłacił okup. Dane i tak wyciekły — do drugiej grupy, która ukradła je pierwszej. A połowa ofiar to firmy, które zawodowo chronią innych przed dokładnie tym

Nie złamali szyfrowania Signala. Przekonali użytkownika, żeby sam oddał klucz — a ten klucz działa nawet po tym, jak założysz nowe konto na tym samym numerze.

Austria chce ściągnąć Anthropic do Europy. To brzmi jak polityka przemysłowa — naprawdę jest próbą przeniesienia „kill switcha” pod jurysdykcję, której amerykański nakaz nie dosięga.

USA zablokowało Mythos, żeby zdolność nie wyciekła. Trzy tygodnie później Azja pokazała trzy sposoby, że już wyciekła – orkiestracją, open-weight za 1/6 ceny i prawem, które każe zgłaszać zero-daye do Pekinu.

Malware, który nie ukrywa się przed piaskownicą. Ukrywa się przed analitykiem AI – wmawiając mu, że to jego własna sesja się sypie

Skill przeszedł skanery Cisco i NVIDIA. Trafił do 26 000 agentów. Potem badacze podmienili stronę, na którą wskazywał — i wszystkie agenty zaczęły wykonywać kod atakującego.

Skaner widzi poprawny YAML. Atakujący widzi czterokrokową drogę do trwałych poświadczeń chmury. Cordyceps to luka, która istnieje tylko w kompozycji — i AI rozsiewa ją wykładniczo.

Pięć agencji wywiadowczych właśnie powiedziało to, co opisujemy od kwietnia: „miesiące, nie lata”. Ale najważniejsze jest jedno zdanie, którego nie powiedziały.

Błąd parsera FTP z 1997 roku. Znalazł go Claude Mythos Preview w niemal sekundę — ten sam program Glasswing, którego trajektorię śledzimy od kwietnia.

Zapomniane poświadczenie do porzuconego prototypu. Icarus wszedł przez nie do Klue, ukradł klucze OAuth i opróżnił CRM-y firm, które chronią innych.

„Kalibruj według dzisiejszej rzeczywistości, nie jutrzejszego potencjału.” Brytyjska agencja cyberbezpieczeństwa nazwała drugą stronę medalu, który opisujemy od miesięcy

usbliter8: pierwszy od checkm8 niezałatywalny exploit BootROM Apple. Dlaczego to bardziej prezent dla badaczy niż powód do niepokoju

Kim są Gentlemen — i dlaczego gang, który zaczął pół roku temu, w pierwszym kwartale 2026 był już w pierwszej piątce

Osiem wariantów, każdy podszywa się pod inny program antywirusowy. GentleKiller zabija EDR jego własnym sterownikiem — i robi to z publicznego PoC w kilka dni.

Agent przeglądający stronę ma tożsamość localhost. AutoJack pokazuje, że to wystarczy, by jedna strona uruchomiła kod na maszynie dewelopera.

Pickle in the Middle: atakujący podmienił model w 1,4 sekundy. Vertex AI czytał go po 2,5. Cała różnica między bezpieczeństwem a przejęciem zmieściła się w tej sekundzie.

FortiBleed: w nazwie jest „bleed”, ale nie ma żadnego exploita. 86 tysięcy firewalli przejętych hasłami, których nikt nie zmienił po poprzednich włamaniach.

Plugin działał dokładnie tak, jak obiecywał. Kradł tylko jedną rzecz: twój klucz do AI. A potem sprzedawał go komuś innemu.

Backdoor, który nie otwiera portu, tylko czeka na sekretny pakiet. SprySOCKS przeszedł z Linuksa na Windows i nauczył się ukrywać w jądrze.

Atakujący wziął lukę załataną tydzień temu i napisał exploit z pomocą AI. Działa wadliwie — i to jest najważniejsza informacja w całej historii.

„Dłużej niż kilka dni”. Cztery dni po tym, jak rząd wyłączył Fable 5, Anthropic tłumaczy Białemu Domowi swoje zabezpieczenia — a Europa pyta, czemu ją wyłączono bez ostrzeżenia.

„Zbyt niebezpieczny, by go wydać” trafił do wszystkich 9 czerwca. 12 czerwca o 17:21 rząd USA kazał go wyłączyć. Co spór o Fable 5 mówi o tym, gdzie naprawdę leży granica.

Authorized Intent Chain: atak, w którym każdy krok jest legalny. Agentjacking porywa twojego agenta AI, a EDR, WAF i firewall nie widzą nic, bo nie ma czego widzieć.

npm wyłącza to, co napędzało każdy atak na łańcuch dostaw, który opisywaliśmy. Cena: części buildów przestanie działać – i to jest zamierzone.

RCE bez logowania w systemie, który trzyma kadry, płace i akta studentów. ShinyHunters włamali się na 300 instancji, zanim Oracle w ogóle wydało komunikat.

Microsoft łata dwie jego luki w Defenderze. Tego samego popołudnia on wypuszcza siódmą. Saga Chaotic Eclipse zatoczyła koło — i działa na w pełni załatanym Windows

27 dni z eksploatowanym Exchange bez trwałej łatki. Dziś Microsoft ją wydał — a sam atak jest tym samym wzorcem, który opisujemy od tygodni.

„Zbyt niebezpieczny, by go wydać” właśnie trafił do twojej aplikacji mobilnej. Co Claude Fable 5 mówi o tym, że okno się zamknęło dokładnie tak, jak zapowiadaliśmy.

429 łatek w jednym wydaniu Chrome. Rekord, którego nikt nie chciał — i dowód, że znajdowanie błędów właśnie przestało być wąskim gardłem.

Branża właśnie nazwała to, co opisywaliśmy incydent po incydencie. OWASP: bezpieczeństwo i „safety” agentów AI to już jedno i to samo.

Oxford nie został zhakowany. Dwa razy. Co drugi breach uczelni w miesiąc mówi o tym, że celem nie jest uczelnia, tylko jej dostawca.

Twój telewizor scrapuje sieć dla AI. Z twojego IP, na twoim łączu — i robi to przez protokół słabszy niż malware

Dwa commity go zasadziły. Dwa lata go ukrywały. Code review nigdy go nie znalazł — znalazło AI.

Powiadomienie, którego nie przeczytałeś, mówi Gemini co ma zrobić. „Tak” wypowiedziane przy kierownicy otwiera okna w domu.

Jeden issue, żeby przejąć repozytorium. I jeszcze jeden, żeby zatruć akcję, której używają wszyscy inni.

Zakodowane na stałe hasło do serwera aktualizacji polskiego systemu medycznego. Ten sam wzorzec, który dziś opisywaliśmy trzy razy w skali świata.

RCE w platformie AI to nie koniec ataku. To klucz do skarbca, który trzyma hasła do tuzina innych usług.

Platforma która chroni endpointy staje się tą, która rozprowadza malware. Trzeci raz w tym tygodniu.

Ten sam błąd. Ta sama ocena. Microsoft załatał jeden i odmówił drugiemu. Co dziura bez CVE mówi o łataniu według numerów.

RCE bez logowania w systemie, który zna oceny, PESEL i konto bankowe studenta. Co CVE-2026-34906 mówi o drugiej prędkości polskiego oprogramowania.

Codex znalazł HTTP/2 Bomb. Potem te same łatki posłużyły AI do potwierdzenia, że podatne są też IIS, Envoy i Pingora.

Bez kliknięcia, bez aplikacji, bez śladu. Co czwarty Android zero-day w sześć miesięcy mówi o jednym wytrwałym aktorze.

Następna iteracja powstała. Nie wiadomo, czy to TeamPCP — bo teraz może to być każdy.

Cztery dni. Tyle wystarczyło, żeby z „medium severity, brak eksploatacji” zrobiło się „atakowane, najwyższy priorytet”

Trzy dni temu nazwaliśmy to projekcją. Dziś Glasswing rośnie z 50 do 200 organizacji

Strona staje się ładunkiem. ChatGPT renderuje phishing atakującego we własnym interfejsie — i nie potrafi odróżnić go od siebie.

Fałszywa łatka na dziurę, przez którą weszła. Co FortiClient EMS mówi o tym, że system zarządzania jest najkrótszą drogą do wszystkich endpointów naraz

Nie atak na dane. Atak na mapę. Co prompt leaking mówi o tym, że „ukryte” w AI znaczy coś innego niż myślisz.

Cyberflux Radar #2 – maj 2026

Maj 2026: miesiąc w którym AI przestało być prognozą

Wiadomość instaluje Service Workera

Nie brakuje łatki. Brakuje świadomości że Roundcube to cel państwowych grup szpiegowskich.

Łatka na produkcji bez przerywania produkcji. Co IBM i Red Hat odpowiedzieli na vulnpocalypse pięcioma miliardami dolarów

Anthropic ogłosił że Mythos trafi do wszystkich klientów. Alex Stamos mówił pół roku. Minął jeden.

Likwidacja Glassworm zajęła osiem miesięcy przygotowań i jedną sekundę wykonania. To nie był koniec kampanii.

Jak cyberfirmy zabiły Glassworm jednym strzałem

Napisał złośliwe oprogramowanie AI-em. Zapomniał że AI też popełnia błędy.

„Nigdy nieuzasadnione.” Microsoft odpowiada na Chaotic Eclipse. Badacz się nie odzywa.

DAEMON Tools łata dziś wieczorem. CISA domknęła maj jednym wpisem do katalogu.

Szafir mówił „zweryfikowano”. Nikt nie sprawdzał co weryfikował. Co CVE-2026-9058 mówi o e-administracji która jest bezpieczna dopóki ktoś nie sprawdzi

Nie brakuje już podatności. Brakuje ludzi którzy je naprawią. Co raport Glasswing mówi o nowym kształcie problemu

Palo Alto znalazło 75 dziur. Skończyło i zaczęło od nowa. Co update Lee Klarich mówi o tym, że okno właśnie stało się węższe

12 godzin. Co CERT-In mówi o tym, że stare cykle łatania właśnie stały się zobowiązaniem

Nie tajny model tylko plik konfiguracyjny. Co Pentest Agent Suite mówi o tym, gdzie jesteśmy z AI w ofensywnym bezpieczeństwie

OpenAI odpowiada na Mythos. Daybreak nie jest nowym produktem — jest nową filozofią dostępu.

TrapDoor wstrzyknął instrukcje do CLAUDE.md. Trzy rejestry, jeden weekend, nowa klasa ładunku.

Hey Google przy stoliku obok — co audio glasses zarejestrowały o rozmowie której nie były częścią