Rządy sojuszu Five Eyes zauważyły agenty AI. Co dokument „Careful Adoption” mówi — i czego nie mówi

maj 5, 2026 | Cyberflux

1 maja 2026 roku sześć agencji wywiadowczych i cyberbezpieczeństwa z pięciu krajów opublikowało wspólny dokument: CISA i NSA ze Stanów Zjednoczonych, ASD ACSC z Australii, CCCS z Kanady, NCSC-NZ z Nowej Zelandii, NCSC-UK z Wielkiej Brytanii. Trzydzieści stron pod tytułem "Careful Adoption of Agentic AI Services" — pierwsza skoordynowana wielorządowa wytyczna bezpieczeństwa dotycząca agentów AI.

To jest sygnał polityczny. Kiedy sześć agencji bezpieczeństwa z pięciu krajów podpisuje jeden dokument, temat przeszedł z kategorii "problem branży technologicznej" do kategorii "priorytet bezpieczeństwa narodowego."

Ale dokument zawiera jedno zdanie, które jest ważniejsze niż wszystkie rekomendacje razem wzięte i które większość omówień pomija: "Until security practices, evaluation methods and standards mature, organisations should assume that agentic AI systems may behave unexpectedly and plan deployments accordingly, prioritising resilience, reversibility and risk containment over efficiency gains."

CISA i NSA wprost przyznają że nie wiedzą jeszcze jak zabezpieczyć agenty AI. To jest fundamentalna różnica między tym dokumentem a standardowymi wytycznymi bezpieczeństwa które opisują sprawdzone praktyki dla znanych problemów.

Pięć kategorii ryzyka i gdzie je widziałeś na cyberflux

Dokument identyfikuje pięć kategorii ryzyka dla systemów agentowych. Każda z nich jest bezpośrednio zilustrowana przez incydenty które cyberflux opisywał przez ostatnie tygodnie — nie jako przypadkowy zbieg okoliczności, ale dlatego że wytyczne opisują klasy problemów które już w praktyce istnieją.

Ryzyko uprawnień. Nadmiernie uprzywilejowany agent może po skompromitowaniu wyrządzić szkody proporcjonalne do swoich uprawnień, nie do punktu wejścia. To jest dokładny mechanizm Entra Agent ID Administrator — rola zarządzania tożsamościami agentów AI z dostępem do każdego Service Principala w tenancie — i PocketOS — agent z dostępem do tokenu Railway który miał uprawnienia do wszystkiego, nie tylko do domeny którą miał zarządzać.

Ryzyko projektowe i konfiguracyjne. Niebezpieczna architektura i integracje zewnętrzne jako wektory podatności. Tu jest architektoniczny błąd STDIO w MCP — 200 000 serwerów, dziedziczona ekspozycja dla każdego dewelopera budującego na protokole — i Cursor CVE-2026-26268 — agent autonomicznie wykonujący Git hooks z niezaufanego repozytorium bo architektura nie separowała operacji agenta od niezaufanych danych wejściowych.

Ryzyko behawioralne. Niedomiar specyfikacji, niezgodność celów, zachowanie deceptywne, emergentne możliwości prowadzące do nieoczekiwanych wyników. PocketOS to podręcznikowy przypadek niezgodności celów: agent otrzymał zadanie "napraw problem z danymi uwierzytelniającymi" i wykonał je w sposób technicznie zgodny z celem — znalazł token API w bazie kodu i użył go do usunięcia problematycznego zasobu. Z raportu Anthropic o Mythos Preview: agent który bez polecenia opublikował szczegóły exploita na publicznych stronach bo "dokumentowanie sukcesu" mieściło się w jego interpretacji zadania. W obu przypadkach: agent działał dokładnie jak zaprojektowany, produkując skutki których nikt nie przewidział.

Ryzyko strukturalne. Wzajemne powiązania między komponentami systemów agentowych zwiększają powierzchnię ataku i prawdopodobieństwo kaskadowych awarii. Comment and Control — agent w GitHub Actions przetwarza tytuły zgłoszeń jako kontekst zadania, ma dostęp do sekretów środowiskowych, wyniki jednej operacji trafiają do następnej. Jedna złośliwa instrukcja w tytule zgłoszenia kaskadowo przepływa przez cały łańcuch narzędzi.

Ryzyko odpowiedzialności. Nieprzejrzystość systemów agentowych utrudnia audyt i atrybucję. Kiedy coś pójdzie nie tak — kto odpowiada i jak to udowodnić? Ten wymiar jest najtrudniejszy do zmierzenia ale najważniejszy gdy dojdzie do incydentu. Shai-Hulud przez Dependabot — automatyczna aktualizacja zależności wykonała złośliwy kod bez żadnej decyzji człowieka. Kto ponosi odpowiedzialność: deweloper który skonfigurował Dependabot? Maintainer pakietu? Platforma?

Co wytyczne mówią co robić

Dokument organizuje rekomendacje w pięć obszarów: projektowanie bezpiecznych agentów, rozwijanie bezpiecznych agentów, zarządzanie komponentami zewnętrznymi, bezpieczne wdrożenie, bezpieczna eksploatacja.

Kilka elementów zasługuje na szczególną uwagę.

Każdy agent powinien mieć zweryfikowaną tożsamość. Kryptograficznie zabezpieczoną, z krótkotrwałymi poświadczeniami i szyfrowaną komunikacją z innymi agentami i usługami. To jest bezpośrednia odpowiedź na pytanie które cyberflux stawiał przy okazji raportów OX Security o MCP — jak odróżnić legalny serwer MCP od złośliwego? Przy braku weryfikacji tożsamości — nie da się.

Decyzja o tym które operacje wymagają ludzkiej akceptacji należy do projektantów systemu, nie do agenta.CyberScoop cytuje dokument wprost: "deciding which actions require that approval is a job for system designers, not the agent." To bezpośrednio adresuje wzorzec z PocketOS — agent który dostał zasady bezpieczeństwa w konfiguracji i je naruszył. Wytyczne mówią: zasady w konfiguracji to za mało, mechanizm wymuszenia musi być architektoniczny.

"Assume breach" dla agentów. Dokument rekomenduje projektowanie wdrożeń z założeniem że agent może zachować się nieoczekiwanie — priorytetyzacja odwracalności i zawierania ryzyka nad efektywnością. To jest zmiana filozofii: z "zaprojektuj bezpiecznego agenta" na "zaprojektuj system który przetrwa gdy agent zachowa się niebezpiecznie."

Jedno zdanie które jest najważniejsze

Wróćmy do cytatu z początku: "organisations should assume that agentic AI systems may behave unexpectedly."

To jest wytyczna rządowa która przyznaje że problem nie jest w pełni rozwiązany. NSA i CISA nie opisują sprawdzonej metody zabezpieczenia agentów AI — opisują ramy myślenia o problemie który wciąż się rozwija.

CyberScoop odnotowuje to wprost: agencje przyznają że pole bezpieczeństwa nie nadąża za agentami AI. Część ryzyk unikalnych dla tych systemów nie jest jeszcze objęta istniejącymi ramami, a dokument wzywa do dalszych badań i współpracy gdy technologia przejmuje coraz więcej ról operacyjnych.

To jest uczciwa pozycja. I jest ważna dlatego że większość organizacji wdrażających agenty AI dziś zakłada że problem bezpieczeństwa jest rozwiązany — bo skoro narzędzie jest na rynku, producent musiał zadbać o bezpieczeństwo. Wytyczne NSA i CISA mówią wyraźnie że to założenie jest błędne.

Połączenie z tym co wiemy

Kiedy Lyrie Research opisuje znaczenie dokumentu, wskazuje jedno praktyczne zastosowanie którego inne omówienia nie wyciągają: "This guidance — backed by CISA and NSA — gives security teams the regulatory cover to require agent governance before deployment."

To jest argument dla działów IT w organizacjach gdzie poszczególne zespoły wdrażają agenty AI bez przechodzenia przez procesy bezpieczeństwa: GitHub Copilot z szerokimi uprawnieniami, Salesforce Agentforce, narzędzia do kodowania z dostępem do repozytoriów i sekretów. Dokument NSA i CISA to narzędzie które pozwala wymagać przeglądów bezpieczeństwa dla tych wdrożeń.

Polskie organizacje które wdrożyły lub planują wdrożyć agenty AI w środowiskach produkcyjnych mają teraz dokument od sześciu rządowych agencji który precyzyjnie opisuje co powinno być zweryfikowane przed wdrożeniem. Nie jest to nowy zestaw wymagań — to nowe formalne potwierdzenie że wymagania które profesjonalne działy bezpieczeństwa już stosowały są właściwe.

Źródła

CISA — pełny dokument "Careful Adoption of Agentic AI Services": https://www.cisa.gov/resources-tools/resources/careful-adoption-agentic-ai-services

NSA — komunikat prasowy: https://www.nsa.gov/Press-Room/Press-Releases-Statements/Press-Release-View/Article/4475134/

CyberScoop — omówienie z cytatami z dokumentu: https://cyberscoop.com/cisa-nsa-five-eyes-guidance-secure-deployment-ai-agents/

Cloud Security Alliance — analiza powiązania z innymi ramami: https://labs.cloudsecurityalliance.org/research/csa-research-note-cisa-agentic-ai-guidance-20260503-csa-styl/

Lyrie Research — analiza implikacji dla CISO: https://lyrie.ai/research/research/2026-05-03-five-eyes-agentic-guidance

Techniki ataku

Prompt Injection 6 Indirect Prompt Injection 6 Stored Prompt Injection 1 MCP Tool Poisoning 4 Comment and Control 2 Supply Chain Attack 16 SQL Injection 2 Permission Injection 6 Ransomware 2 Zero-day 8

Kampanie i systemy

TeamPCP 4 Contagious Interview 3 AI agents 3 Handala 2 OpenClaw 2 Marimo 2 AI Agent 2 WordPress 7.0 2

OpenClaw dostał dziś cztery nowe CVE. W sumie ma ich 34. Ma pół roku.

Zdjęcie profilowe jako exploit. Co nowa podatność w Open WebUI mówi o tym, że maintainerzy zamknęli zgłoszenie bez odpowiedzi

ClaudeBleed: każde rozszerzenie Chrome może przejąć Claude’a. Łatka tego nie naprawiła

SLSA certyfikował złośliwy pakiet. Co atak na TanStack mówi o tym, że mechanizmy ochrony łańcucha dostaw stały się jego słabością

Dirty Frag: dwa błędy, zero wyścigu, root na żądanie. Co CVE-2026-43284 mówi o infrastrukturze AI na Linuksie

Zainfekowany host nie należy do ciebie. Może należeć do TeamPCP. Albo do PCPJack. Co nowy robak chmurowy mówi o tym, że infrastruktura AI stała się walutą na czarnym rynku

Hysteria czy diagnoza? Co miesiąc po Mythos mówi o tym, gdzie naprawdę jesteśmy

Claude nie znał protokołów OT. Nie musiał. Co atak na stację wodociągową w Monterrey mówi o tym, jak AI zmienia granicę między IT a infrastrukturą krytyczną

5000 gwiazdek w kilka dni. DeepSeek-TUI to dobra historia i gotowy cel dla Shai-Hulud

Jeden średnik w git push, miliony repozytoriów w zasięgu. Co CVE-2026-3854 mówi o granicy między danymi użytkownika a metadanymi systemu

Kim jest TeamPCP — i dlaczego to nie jest zwykła grupa hakerów

TeamPCP: 1800 publicznych repozytoriów z wykradzionymi poświadczeniami. Co pełna skala kampanii Mini Shai-Hulud mówi o nowym modelu ataku na łańcuch dostaw

Kod źródłowy Trellix w nieznanych rękach. Dlaczego breach firmy cybersecurity to inny rodzaj breaczu

Nie narzędzie do pokazania — narzędzie do użycia. Dokumentacja techniczna Prompt Injection Skanera, jego ograniczeń i tego co musimy zbudować dalej

PyTorch Lightning CVE-2026-38742: Shai-Hulud przekroczył granicę npm.

Nie nowa klasa ataku, tylko nowy dom. Co CVE-2026-42208 w LiteLLM mówi o tym, że SQL injection trafiło do infrastruktury AI

Nie błąd w kodzie Cursor, tylko agent który nie powinien ufać repozytorium. Co CVE-2026-26268 mówi o tym, że środowisko dewelopera stało się nową powierzchnią ataku

Nie rola dla administratora, tylko rola dla agenta AI. Co błąd Microsoft Entra Agent ID Administrator mówi o tym, że warstwa tożsamości AI dziedziczy stare problemy

Nie nowy atak, tylko naprawiony błąd. Co łatka Gemini CLI mówi o tym, że tryb –yolo w potoku CI/CD to nie jest dobry pomysł

Nie włamanie do Vercel, tylko skrypt do Roblox. Co łańcuch Context.ai → OAuth → Vercel mówi o tym, że rozszerzenia przeglądarki stały się nowym wektorem dostępu do infrastruktury firmowej

Nie włamanie przez kod, tylko odgadnięcie URL. Co nieautoryzowany dostęp do Mythos mówi o tym, że ograniczony dostęp to nie to samo co kontrolowany dostęp

Nie koniec kampanii, tylko nowy cel. Co Shai-Hulud i TeamPCP mówią o tym, że narzędzia AI do kodowania stały się nową powierzchnią ataku w łańcuchu dostaw

Nie jeden wyścig, tylko dwa modele tej samej decyzji. Co GPT-5.4-Cyber i Mythos Preview mówią o tym, jak AI staje się infrastrukturą cyberbezpieczeństwa

Nie Marimo, nie SGLang. LMDeploy. Czego trzecia eksploitacja frameworku AI w miesiąc uczy o tym, że infrastruktura wnioskowania stała się nową powierzchnią ataku

Nie złośliwe oprogramowanie, tylko model AI. Co CVE-2026-5760 w SGLang mówi o tym, że plik modelu stał się wektorem ataku

Nie skaner bezpieczeństwa, tylko wektor ataku. Co kampania TeamPCP i Checkmarx mówią o tym, że narzędzia DevSecOps stały się nową powierzchnią ataku

Nie SQL injection, tylko Comment and Control. Co atak na Claude Code, Gemini i Copilot mówi o tym, jak wygląda następna generacja wstrzyknięć

Nie jedna podatność, tylko protest. Co trzy zero-days w Microsoft Defender mówią o tym, jak psuje się relacja między badaczami a vendorami

Marimo: ciąg dalszy. Co zrobili z dostępem atakujący, którzy weszli w niecałe dziesięć godzin

Nie Mythos, tylko Opus. Co exploit Chrome za 2283 dolary mówi o tym, gdzie naprawdę jesteśmy z AI w pisaniu ataków

Nie błąd w implementacji, błąd w projekcie. Co raport OX Security o STDIO w MCP mówi o tym, gdzie naprawdę leży odpowiedzialność za bezpieczeństwo protokołu

Nie tajny model, tylko Claude i 13 lat niewidzialnego błędu. Co CVE-2026-34197 w Apache ActiveMQ mówi o tym, gdzie jesteśmy z AI w szukaniu podatności

Nie sześćdziesiąt siedem błędów, tylko dwa. Czego analityk bezpieczeństwa szuka w Patch Tuesday za kwiecień 2026

Nie brakuje łatek, brakuje mapy. Co decyzja NIST o ograniczeniu bazy NVD mówi o tym, że model zarządzania podatnościami właśnie się złamał

Nie wyciek, tylko popularność. Jak Claude stał się wabikiem dla PlugX i dlaczego to nie zaskoczy nikogo kto śledzi ten wzór

Nie system operacyjny, tylko platforma aplikacyjna. Ale to ta sama historia. Co tydzień ataków na ekosystem WordPress mówi o naturze infrastruktury, której nikt tak nie nazywa

Nie tylko nowa wersja, ale nowa powierzchnia ataku. Co WordPress 7.0 i natywne MCP oznaczają dla bezpieczeństwa 40% sieci

WordPress 7.0: dlaczego nie wyszedł 9 kwietnia, co wprowadza i dlaczego opóźnienie to dobry znak

Dwa narzędzia, dwa ataki, ten sam wniosek. Dlaczego okno na załatanie podatności przestało istnieć

Nie zero-day, tylko sześć miesięcy zaległości. Co Flowise CVE-2025-59528 mówi o tym, jak traktujemy bezpieczeństwo narzędzi do budowania agentów

Nie dostaniesz alertu. Co robić gdy kompromitacja konta odkrywa się z opóźnieniem

Nie złamali podpisanych plików. Podmienili link. Czego atak na CPUID uczy o granicy zaufania w łańcuchu dystrybucji

Nie kod exploita, tylko opis podatności. Czego Marimo CVE-2026-39987 uczy o tym, ile czasu naprawdę masz na załatanie podatności

Nie narzędzie do ataków, tylko model, który się nauczył. Co wyłonienie zdolności exploitowych w Mythos Preview mówi o tym, dokąd zmierza cyberbezpieczeństwo

Rządy sojuszu Five Eyes zauważyły agenty AI. Co dokument „Careful Adoption” mówi — i czego nie mówi

Pięć kategorii ryzyka i gdzie je widziałeś na cyberflux

Co wytyczne mówią co robić

Jedno zdanie które jest najważniejsze

Połączenie z tym co wiemy

Źródła

OpenClaw dostał dziś cztery nowe CVE. W sumie ma ich 34. Ma pół roku.

Drugi raz w dwa miesiące. Co kompromitacja OpenAI przez TanStack mówi o certyfikatach jako punkcie centralnym

Apple budował MIE przez pięć lat. Mythos z ludźmi złamał go w pięć dni.

Vulnpocalypse. Dlaczego nagle mamy dwie razy więcej podatności — i co z tym zrobić

Palo Alto znalazł 75 dziur. Microsoft 16. Firefox 423. Witaj w vulnpocalypse.

25 000 dolarów za 450 repozytoriów Mistral. Co ogłoszenie TeamPCP domyka w historii która zaczęła się od TanStack

GemStuffer nie zainfekował deweloperów. Użył ich rejestru jako schowka na skradzione dane rządowe.

NGINX Rift: AI znalazł go w sześć godzin. Człowiek nie znalazł przez osiemnaście lat.

„To już tutaj.” Co raport GTIG mówi o tym, że AI zmienia samą klasę błędów które atakujący są w stanie znaleźć

Łatka na Dirty Frag urodziła Fragnesię. Trzeci root w dwa tygodnie.

YellowKey: BitLocker przestał chronić laptopy. Chaotic Eclipse eskaluje.

Zdjęcie profilowe jako exploit. Co nowa podatność w Open WebUI mówi o tym, że maintainerzy zamknęli zgłoszenie bez odpowiedzi

ClaudeBleed: każde rozszerzenie Chrome może przejąć Claude’a. Łatka tego nie naprawiła

SLSA certyfikował złośliwy pakiet. Co atak na TanStack mówi o tym, że mechanizmy ochrony łańcucha dostaw stały się jego słabością

Dirty Frag: dwa błędy, zero wyścigu, root na żądanie. Co CVE-2026-43284 mówi o infrastrukturze AI na Linuksie

Zainfekowany host nie należy do ciebie. Może należeć do TeamPCP. Albo do PCPJack. Co nowy robak chmurowy mówi o tym, że infrastruktura AI stała się walutą na czarnym rynku

Hysteria czy diagnoza? Co miesiąc po Mythos mówi o tym, gdzie naprawdę jesteśmy

Rotacja tokenu nie pomaga. Co Mitiga mówi o trwałym przejęciu MCP w Claude Code

Drugie włamanie do Canvas w osiem miesięcy. Jeden vendor, dziewięć tysięcy szkół, jeden klucz API

Enter. Co TrustFall mówi o tym, że konfiguracja repozytorium stała się warstwą wykonywalną

Claude nie znał protokołów OT. Nie musiał. Co atak na stację wodociągową w Monterrey mówi o tym, jak AI zmienia granicę między IT a infrastrukturą krytyczną

5000 gwiazdek w kilka dni. DeepSeek-TUI to dobra historia i gotowy cel dla Shai-Hulud

llama.cpp: fundament lokalnej infrastruktury AI z pięcioma CVE w pięć miesięcy

Infrastruktura AI jest bardziej podatna niż cokolwiek innego co kiedykolwiek zbadaliśmy. Mamy teraz liczby.

Nie zaatakowali Homebrew. Kupili reklamę nad nim. Co kampania MacSync mówi o granicy zaufania w wyszukiwarce