Hysteria czy diagnoza? Co miesiąc po Mythos mówi o tym, gdzie naprawdę jesteśmy

maj 9, 2026 | Cyberflux

Miesiąc temu Anthropic ogłosił Claude Mythos Preview. Banki centralne, wielkie instytucje finansowe i administracja federalna weszły w tryb reagowania kryzysowego. Ben Harris, CEO watchTowr Labs, opisuje rozmowy z bankami, ubezpieczycielami i regulatorami jako "histerię."

Słowo "histeria" jest nieprecyzyjne. To co Harris obserwuje to nie irracjonalny strach — to racjonalna reakcja na nową informację, przyspieszona przez brak kontekstu który powinien być dostępny od dawna.

Problem nie w tym że Mythos jest nieistotny. Problem w tym że strach który wzbudził jest spóźniony o kilkanaście miesięcy.

Zdolności których się obawiali istnieją od ubiegłego roku

Zdanie które Anthropic musi zestawić z narracją o Mythos jako przełomie pochodzi od ich własnego rzecznika, cytowanego przez CNBC: firma wskazała na wpis blogowy z lutego 2026 pokazujący że Claude Opus 4.6 — powszechnie dostępny model — znalazł ponad 500 podatności wysokiego ryzyka w oprogramowaniu open source.

Opus 4.6. Nie Mythos. Dostępny dla każdego z subskrypcją. Luty 2026.

Ben Harris z watchTowr ujmuje to bez dyplomatycznych osłonek: "Widzimy teraz w branży że ludzie są w stanie odtworzyć podatności znalezione przez Mythos przez sprytną orkiestrację modeli publicznych — z bardzo, bardzo podobnymi wynikami."

Pisaliśmy o tym w kwietniu przy okazji eksploitu Chrome za 2283 dolary na standardowym Opus 4.6 — badacz Hacktron bez specjalizacji w exploitach przeglądarkowych, tydzień pracy, tydzień pracy z pomocą standardowego modelu. Zdanie które wówczas wyciągnęliśmy jako serce tamtej historii: "Jeśli Opus potrafi to co właśnie pokazałem, ekstrapoluj do Mythos."

Vidoc znalazło się w tej samej pozycji metodycznie: uruchomili starszy model Anthropic i OpenAI na tych samych bazach kodu co Mythos. Wyniki: bardzo podobne. AISLE poszło jeszcze dalej, publikując wynik który jest jednym z najcelniejszych zdań o tym temacie: "Tysiąc kompetentnych detektywów przeszukujących wszystko wszędzie znajdzie więcej błędów niż jeden genialny detektyw który musi zgadywać gdzie szukać."

Mythos jest bardziej autonomiczny i bardziej skuteczny niż starsze modele. Ale zdolność do znajdowania podatności na dużą skalę nie pojawiła się z Mythos. Pojawiła się wcześniej i była dostępna publicznie.

Dwie narracje, jeden problem

Są dwie konkurencyjne narracje o Mythos i branża nie może się zdecydować która przyjąć.

Narracja pierwsza, oficjalna: Mythos to przełom który wymaga bezprecedensowych środków ostrożności — stąd Project Glasswing, stąd ograniczony dostęp dla czterdziestu organizacji, stąd briefingi dla prezesa Fed i sekretarza skarbu.

Narracja druga, od praktyków: zdolności którymi straszy Mythos są już dostępne dla każdego kto wie jak orkiestrować modele, i "hysteria" wokół Mythos odciąga uwagę od tego że problem istniał przed jego ogłoszeniem.

Obie narracje są jednocześnie prawdziwe i to jest właśnie trudne.

Mythos jest rzeczywiście bardziej autonomiczny — pisaliśmy o tym po raporcie Anthropic Red Team: 181 działających exploitów gdzie Opus osiągnął dwa, FreeBSD RCE bez udziału człowieka, sedemmiesięczny błąd w FFmpeg. Różnica między Mythos a Opus to nie jest tylko skala — to jest różnica w poziomie autonomii. Mythos robi rzeczy bez człowieka. Opus robi te same rzeczy z pomocą człowieka.

Ale "z pomocą człowieka" przy koszcie 2283 dolarów za exploit Chrome i przy dostępności dla każdego kto ma konto — to jest właśnie punkt który Harris, Kloc i AISLE próbują przekazać regulatorom którzy skupili się na Mythos jako granicy.

GPT-5.5-Cyber i logika eskalacji

Dzień po publikacji artykułu CNBC, OpenAI ogłosiło GPT-5.5-Cyber — szerszy dostęp dla zweryfikowanych zespołów cyberbezpieczeństwa, mniej ograniczeń dla legalnych zadań bezpieczeństwa, możliwość pisania proof-of-concept dla znalezionych błędów i testowania posture bezpieczeństwa organizacji.

Źródło Axios które ma dostęp do danych benchmarkowych mówi wprost: GPT-5.5-Cyber ma możliwości "mniej więcej na poziomie Mythos." Jeden test niedawno umieścił Mythos nieco wyżej.

Opisywaliśmy wcześniej logikę obu modeli — Anthropic przez przynależność organizacyjną, OpenAI przez weryfikację indywidualną. Teraz ta sama logika, miesiąc później, w kontekście raportu CNBC który mówi że zdolności i tak są dostępne publicznie.

Justin Herring z Mayer Brown ujmuje fundamentalny paradoks: "Masz znaczący wzrost liczby odkrywanych podatności, ale nie wydaje się żebyś wdrożył narzędzie które pomaga je naprawiać."

To jest zdanie które Mandiant potwierdził statystyką w M-Trends 2026: mediana czasu eksploitacji minus siedem dni. Luka między odkryciem a naprawą nie skurczyła się od ogłoszenia Mythos. Przeciwnie — odkrywanie przyspiesza szybciej niż naprawa.

Tiers of haves and have-nots

Pavel Gurvich z Tenzai wskazuje na konsekwencję ograniczonego dostępu którą cyberflux sygnalizował już w marcu: "Stworzyło to hierarchię posiadających i nieposiadających, co może zahamować tempo innowacji w cyberbezpieczeństwie."

Badacze AI nie dostali dostępu do Mythos żeby niezależnie zweryfikować twierdzenia Anthropic ani żeby zacząć budować mechanizmy obrony przed nim. Pięćdziesiąt organizacji ma dostęp. Reszta branży pracuje z zewnętrznymi opisami możliwości i własną inżynierią wsteczną przez starsze modele.

Ben Seri z Zafran Security: "Próbują rozgryźć jak najlepiej naprawić świat zanim świat dostanie do tego dostęp. To jest sytuacja jajko-kura i nieuchronnie rozbijecie trochę jajek."

To jest uczciwa diagnoza. Ale zestawiona z obserwacją że możliwości i tak są dostępne przez orkiestrację starszych modeli — nasuwa pytanie czy "naprawianie świata przed udostępnieniem" opiera się na założeniu które jest już nieaktualne.

Jeden miesiąc, trzy obserwacje

Miesiąc po Mythos branża ma trzy oddzielne, trudne do pogodzenia obserwacje.

Pierwsza: Mythos jest rzeczywiście bardziej autonomiczny i skuteczny niż poprzednie modele. Raport AISI potwierdza 73% skuteczność na zadaniach CTF poziom ekspercki gdzie wcześniej wynik wynosił zero.

Druga: Zbliżone zdolności są reprodukowalne przez starsze modele z orkiestracją i koordynacją. Tysiąc kompetentnych detektywów wygrywa z jednym genialnym.

Trzecia: Luka między odkrywaniem podatności a ich naprawą rośnie. Mandiant dokumentuje ujemną medianę czasu eksploitacji. NIST przyznał że nie nadąża z bazą CVE. Opisywaliśmy Marimo exploitowane w 9h 41min, LiteLLM w 36 godzin, Flowise nieaktualizowane przez pół roku.

Żadna z tych obserwacji nie neguje pozostałych. Wszystkie trzy są prawdziwe jednocześnie. I właśnie dlatego słowo "hysteria" jest nieprecyzyjne — bo opisuje intensywność reakcji bez opisywania czy reakcja dotyczy właściwej zmiennej.

Regulatorzy reagują na Mythos jako na przełom. Praktycy mówią że przełom był wcześniej. Obie strony mają rację o innej rzeczy.

Gdzie to zostawia obrońców

Dario Amodei powiedział na wydarzeniu Anthropic w tym tygodniu że niebezpieczeństwo tkwi w "ogromnym wzroście liczby podatności, naruszeń, szkód finansowych z ransomware dla szkół, szpitali, nie mówiąc o bankach."

To jest właściwy opis ryzyka. Ale Harris wskazuje że branża była w tym miejscu zanim pojawił się Mythos — i że ograniczony dostęp do jednego modelu nie zmienia kalkulacji dla atakujących którzy mają dostęp do publicznych modeli i orkiestracji.

Praktyczny wniosek dla obrońców jest ten sam co przed Mythos, po Mythos i niezależnie od tego kto wygra porównanie benchmarkowe między Mythos a GPT-5.5-Cyber: tempo eksploitacji rośnie, tempo naprawy nie nadąża, a narzędzia które mogłyby skrócić czas naprawy są dostępne dla obrońców — ale wymagają inwestycji w procesy, nie tylko w dostęp do modelu.

Hysteria czy diagnoza? Co miesiąc po Mythos mówi o tym, gdzie naprawdę jesteśmy

Zdolności których się obawiali istnieją od ubiegłego roku

Dwie narracje, jeden problem

GPT-5.5-Cyber i logika eskalacji

Tiers of haves and have-nots

Jeden miesiąc, trzy obserwacje

Gdzie to zostawia obrońców

Źródła

DeepSeek nie znalazł luki. Wymyślił sposób ataku, którego obrońcy nie brali pod uwagę — składając go z funkcji, która w przeglądarce jest legalna.

Cyberflux Radar #3 – czerwiec 2026

Czerwiec 2026 — miesiąc, w którym zdolność pokazała, że nie da się zamknąć

Klue zapłacił okup. Dane i tak wyciekły — do drugiej grupy, która ukradła je pierwszej. A połowa ofiar to firmy, które zawodowo chronią innych przed dokładnie tym

Nie złamali szyfrowania Signala. Przekonali użytkownika, żeby sam oddał klucz — a ten klucz działa nawet po tym, jak założysz nowe konto na tym samym numerze.

Austria chce ściągnąć Anthropic do Europy. To brzmi jak polityka przemysłowa — naprawdę jest próbą przeniesienia „kill switcha” pod jurysdykcję, której amerykański nakaz nie dosięga.

USA zablokowało Mythos, żeby zdolność nie wyciekła. Trzy tygodnie później Azja pokazała trzy sposoby, że już wyciekła – orkiestracją, open-weight za 1/6 ceny i prawem, które każe zgłaszać zero-daye do Pekinu.

Malware, który nie ukrywa się przed piaskownicą. Ukrywa się przed analitykiem AI – wmawiając mu, że to jego własna sesja się sypie

Skill przeszedł skanery Cisco i NVIDIA. Trafił do 26 000 agentów. Potem badacze podmienili stronę, na którą wskazywał — i wszystkie agenty zaczęły wykonywać kod atakującego.

Skaner widzi poprawny YAML. Atakujący widzi czterokrokową drogę do trwałych poświadczeń chmury. Cordyceps to luka, która istnieje tylko w kompozycji — i AI rozsiewa ją wykładniczo.

Pięć agencji wywiadowczych właśnie powiedziało to, co opisujemy od kwietnia: „miesiące, nie lata”. Ale najważniejsze jest jedno zdanie, którego nie powiedziały.

Błąd parsera FTP z 1997 roku. Znalazł go Claude Mythos Preview w niemal sekundę — ten sam program Glasswing, którego trajektorię śledzimy od kwietnia.

Zapomniane poświadczenie do porzuconego prototypu. Icarus wszedł przez nie do Klue, ukradł klucze OAuth i opróżnił CRM-y firm, które chronią innych.

„Kalibruj według dzisiejszej rzeczywistości, nie jutrzejszego potencjału.” Brytyjska agencja cyberbezpieczeństwa nazwała drugą stronę medalu, który opisujemy od miesięcy

usbliter8: pierwszy od checkm8 niezałatywalny exploit BootROM Apple. Dlaczego to bardziej prezent dla badaczy niż powód do niepokoju

Kim są Gentlemen — i dlaczego gang, który zaczął pół roku temu, w pierwszym kwartale 2026 był już w pierwszej piątce

Osiem wariantów, każdy podszywa się pod inny program antywirusowy. GentleKiller zabija EDR jego własnym sterownikiem — i robi to z publicznego PoC w kilka dni.

Agent przeglądający stronę ma tożsamość localhost. AutoJack pokazuje, że to wystarczy, by jedna strona uruchomiła kod na maszynie dewelopera.

Pickle in the Middle: atakujący podmienił model w 1,4 sekundy. Vertex AI czytał go po 2,5. Cała różnica między bezpieczeństwem a przejęciem zmieściła się w tej sekundzie.

FortiBleed: w nazwie jest „bleed”, ale nie ma żadnego exploita. 86 tysięcy firewalli przejętych hasłami, których nikt nie zmienił po poprzednich włamaniach.

Plugin działał dokładnie tak, jak obiecywał. Kradł tylko jedną rzecz: twój klucz do AI. A potem sprzedawał go komuś innemu.

Backdoor, który nie otwiera portu, tylko czeka na sekretny pakiet. SprySOCKS przeszedł z Linuksa na Windows i nauczył się ukrywać w jądrze.

Atakujący wziął lukę załataną tydzień temu i napisał exploit z pomocą AI. Działa wadliwie — i to jest najważniejsza informacja w całej historii.

„Dłużej niż kilka dni”. Cztery dni po tym, jak rząd wyłączył Fable 5, Anthropic tłumaczy Białemu Domowi swoje zabezpieczenia — a Europa pyta, czemu ją wyłączono bez ostrzeżenia.

„Zbyt niebezpieczny, by go wydać” trafił do wszystkich 9 czerwca. 12 czerwca o 17:21 rząd USA kazał go wyłączyć. Co spór o Fable 5 mówi o tym, gdzie naprawdę leży granica.

Authorized Intent Chain: atak, w którym każdy krok jest legalny. Agentjacking porywa twojego agenta AI, a EDR, WAF i firewall nie widzą nic, bo nie ma czego widzieć.

npm wyłącza to, co napędzało każdy atak na łańcuch dostaw, który opisywaliśmy. Cena: części buildów przestanie działać – i to jest zamierzone.

RCE bez logowania w systemie, który trzyma kadry, płace i akta studentów. ShinyHunters włamali się na 300 instancji, zanim Oracle w ogóle wydało komunikat.

Microsoft łata dwie jego luki w Defenderze. Tego samego popołudnia on wypuszcza siódmą. Saga Chaotic Eclipse zatoczyła koło — i działa na w pełni załatanym Windows

27 dni z eksploatowanym Exchange bez trwałej łatki. Dziś Microsoft ją wydał — a sam atak jest tym samym wzorcem, który opisujemy od tygodni.

„Zbyt niebezpieczny, by go wydać” właśnie trafił do twojej aplikacji mobilnej. Co Claude Fable 5 mówi o tym, że okno się zamknęło dokładnie tak, jak zapowiadaliśmy.

429 łatek w jednym wydaniu Chrome. Rekord, którego nikt nie chciał — i dowód, że znajdowanie błędów właśnie przestało być wąskim gardłem.

Branża właśnie nazwała to, co opisywaliśmy incydent po incydencie. OWASP: bezpieczeństwo i „safety” agentów AI to już jedno i to samo.

Oxford nie został zhakowany. Dwa razy. Co drugi breach uczelni w miesiąc mówi o tym, że celem nie jest uczelnia, tylko jej dostawca.

Twój telewizor scrapuje sieć dla AI. Z twojego IP, na twoim łączu — i robi to przez protokół słabszy niż malware

Dwa commity go zasadziły. Dwa lata go ukrywały. Code review nigdy go nie znalazł — znalazło AI.

Powiadomienie, którego nie przeczytałeś, mówi Gemini co ma zrobić. „Tak” wypowiedziane przy kierownicy otwiera okna w domu.

Jeden issue, żeby przejąć repozytorium. I jeszcze jeden, żeby zatruć akcję, której używają wszyscy inni.

Zakodowane na stałe hasło do serwera aktualizacji polskiego systemu medycznego. Ten sam wzorzec, który dziś opisywaliśmy trzy razy w skali świata.

RCE w platformie AI to nie koniec ataku. To klucz do skarbca, który trzyma hasła do tuzina innych usług.

Platforma która chroni endpointy staje się tą, która rozprowadza malware. Trzeci raz w tym tygodniu.

Ten sam błąd. Ta sama ocena. Microsoft załatał jeden i odmówił drugiemu. Co dziura bez CVE mówi o łataniu według numerów.

RCE bez logowania w systemie, który zna oceny, PESEL i konto bankowe studenta. Co CVE-2026-34906 mówi o drugiej prędkości polskiego oprogramowania.

Codex znalazł HTTP/2 Bomb. Potem te same łatki posłużyły AI do potwierdzenia, że podatne są też IIS, Envoy i Pingora.

Bez kliknięcia, bez aplikacji, bez śladu. Co czwarty Android zero-day w sześć miesięcy mówi o jednym wytrwałym aktorze.

Następna iteracja powstała. Nie wiadomo, czy to TeamPCP — bo teraz może to być każdy.

Cztery dni. Tyle wystarczyło, żeby z „medium severity, brak eksploatacji” zrobiło się „atakowane, najwyższy priorytet”

Trzy dni temu nazwaliśmy to projekcją. Dziś Glasswing rośnie z 50 do 200 organizacji

Strona staje się ładunkiem. ChatGPT renderuje phishing atakującego we własnym interfejsie — i nie potrafi odróżnić go od siebie.

Fałszywa łatka na dziurę, przez którą weszła. Co FortiClient EMS mówi o tym, że system zarządzania jest najkrótszą drogą do wszystkich endpointów naraz

Nie atak na dane. Atak na mapę. Co prompt leaking mówi o tym, że „ukryte” w AI znaczy coś innego niż myślisz.

Cyberflux Radar #2 – maj 2026

Maj 2026: miesiąc w którym AI przestało być prognozą

Wiadomość instaluje Service Workera

Nie brakuje łatki. Brakuje świadomości że Roundcube to cel państwowych grup szpiegowskich.

Łatka na produkcji bez przerywania produkcji. Co IBM i Red Hat odpowiedzieli na vulnpocalypse pięcioma miliardami dolarów

Anthropic ogłosił że Mythos trafi do wszystkich klientów. Alex Stamos mówił pół roku. Minął jeden.

Likwidacja Glassworm zajęła osiem miesięcy przygotowań i jedną sekundę wykonania. To nie był koniec kampanii.

Jak cyberfirmy zabiły Glassworm jednym strzałem

Napisał złośliwe oprogramowanie AI-em. Zapomniał że AI też popełnia błędy.

„Nigdy nieuzasadnione.” Microsoft odpowiada na Chaotic Eclipse. Badacz się nie odzywa.

DAEMON Tools łata dziś wieczorem. CISA domknęła maj jednym wpisem do katalogu.

Szafir mówił „zweryfikowano”. Nikt nie sprawdzał co weryfikował. Co CVE-2026-9058 mówi o e-administracji która jest bezpieczna dopóki ktoś nie sprawdzi

Nie brakuje już podatności. Brakuje ludzi którzy je naprawią. Co raport Glasswing mówi o nowym kształcie problemu

Palo Alto znalazło 75 dziur. Skończyło i zaczęło od nowa. Co update Lee Klarich mówi o tym, że okno właśnie stało się węższe

12 godzin. Co CERT-In mówi o tym, że stare cykle łatania właśnie stały się zobowiązaniem

Nie tajny model tylko plik konfiguracyjny. Co Pentest Agent Suite mówi o tym, gdzie jesteśmy z AI w ofensywnym bezpieczeństwie

OpenAI odpowiada na Mythos. Daybreak nie jest nowym produktem — jest nową filozofią dostępu.

TrapDoor wstrzyknął instrukcje do CLAUDE.md. Trzy rejestry, jeden weekend, nowa klasa ładunku.

Hey Google przy stoliku obok — co audio glasses zarejestrowały o rozmowie której nie były częścią

Model Google, runtime developera, dane między — kto odpowiada za incident w architekturze Antigravity SDK

197 milionów parametrów, zero dodatkowej zgody — co Google zrobił z weights.bin po Gemma 197M