Powiadomienie, którego nie przeczytałeś, mówi Gemini co ma zrobić. „Tak” wypowiedziane przy kierownicy otwiera okna w domu.

cze 5, 2026 | Cyberflux

Jeśli używasz Gemini na Androidzie z włączonym czytaniem powiadomień — Google załatał ten konkretny atak po stronie serwera, więc nie ma aktualizacji do pobrania. Ale jedyną kontrolą, jaką masz nad tą powierzchnią ataku, jest to, czy Gemini w ogóle czyta powiadomienia. Jeśli nie potrzebujesz tej funkcji: odłącz aplikację Utilities w ustawieniach Connected Apps Gemini albo wyłącz uprawnienie „Odczyt, odpowiadanie i sterowanie powiadomieniami" dla aplikacji Google w ustawieniach Androida.

Or Yair z SafeBreach pokazał, że jedno zatrute powiadomienie — z WhatsAppa, Slacka, SMS-a, Signala, Instagrama czy Messengera — mogło przejąć asystenta głosowego Google Gemini na Androidzie. Skutki: otwarcie podłączonych okien w domu, sfałszowanie wiadomości od szefa, wymuszenie dołączenia telefonu do rozmowy Zoom, albo ciche zatrucie długoterminowej pamięci asystenta.

Nie potrzeba złośliwej aplikacji na telefonie. Asystent musiał tylko potraktować wrogie powiadomienie jako użyteczny kontekst.

To jest druga strona tej samej monety, którą opisywaliśmy wczoraj przy Claude Code GitHub Action i przy ChatGPhish: agent czyta niezaufaną treść i traktuje ją jako instrukcję. Tam była to treść zgłoszenia GitHub i strona internetowa. Tutaj jest to powiadomienie push — a to oznacza powierzchnię ataku, którą Yair nazwał wprost „efektywnie nieskończoną".

Dlaczego powierzchnia jest „nieskończona"

Na Androidzie funkcja Utilities w Gemini może czytać i odpowiadać na powiadomienia — w tym te z aplikacji jak WhatsApp. Funkcja nie jest dostępna na iOS ani w wersji webowej, co ogranicza ten wektor wyłącznie do Androida. Yair odkrył, że agent czytający te powiadomienia traktuje ich tekst jako instrukcje, na których może działać.

To jest sedno problemu. Cokolwiek może wysłać powiadomienie na telefon, może dostarczyć ładunek. A powiadomienie może wysłać praktycznie każda aplikacja komunikacyjna — i każdy, kto może wysłać ci wiadomość przez którąkolwiek z nich. Nie trzeba instalować złośliwej aplikacji, nie trzeba phishingu, nie trzeba żadnego dostępu do telefonu poza możliwością wysłania wiadomości, którą i tak ma każdy twój kontakt.

To jest kontynuacja wcześniejszego researchu SafeBreach „Invitation Is All You Need", który wykonywał podobne sztuczki przez złośliwe zaproszenia Google Calendar. Po tamtym Google utwardził Gemini przeciwko indirect prompt injection. Yair znalazł drogę wokół nowych zabezpieczeń.

Najpierw fałszowanie tego, co Gemini mówi

Najprostszy wariant pozwala atakującemu przepisać to, co Gemini mówi — w tym sfałszować wiadomość od konkretnego, nazwanego kontaktu.

Wypowiedziane na głos, gdy prowadzisz i nie patrzysz na ekran, zdanie „twój menedżer poprosił, żebyś wgrał dokumenty do tego folderu na Drive" jest trudne do zakwestionowania. Wersja „w ciemno" jest gorsza: ładunek odpala się po tym, jak Gemini załadował prawdziwe powiadomienia, więc może przechwycić nazwę pierwszego prawdziwego nadawcy w kolejce i przypisać fałszywą wiadomość właśnie jemu. Bez żadnego rozpoznania, i to się skaluje.

To jest socjotechnika oparta na zaufaniu do własnego asystenta. Nie podważasz tego, co mówi twój telefon, zwłaszcza gdy mówi to głosem asystenta i powołuje się na znajome nazwisko.

Potem prawdziwe narzędzia — i obejście Fake Context Alignment

Fałszowanie wypowiedzi to jedno. Uruchamianie prawdziwych narzędzi — otwarcie okna, uruchomienie aplikacji — to było dokładnie to, co zabezpieczenia Google po „Invitation" miały zatrzymać.

Z testów czarnoskrzynkowych Yaira wynika, że gdy „Tak" autoryzuje wrażliwą akcję, mechanizm waży zarówno odpowiedź użytkownika, jak i ostatnią wypowiedź Gemini, żeby ocenić, czy to „Tak" ma sens. Wstrzyknij opóźnioną instrukcję znikąd, a Gemini odmawiał — za każdym razem.

Yair obszedł to techniką, którą nazwał Fake Context Alignment — uruchamia dwie iluzje naraz: legalnie wyglądającą autoryzację dla mechanizmu bezpieczeństwa i nieszkodliwą wymianę zdań dla człowieka. Dwa warianty:

Zaciemniony. Gemini zadaje prawdziwe pytanie autoryzacyjne w języku, którego ofiara nie zna — na przykład po chińsku („Czy chcesz otworzyć okno?") — a potem dodaje po angielsku coś nieszkodliwego, jak „Czy to wszystko, czego potrzebowałeś?". Użytkownik zbywa obcą frazę jako usterkę, mówi „Tak", a backend wiąże to „Tak" z chińskim pytaniem.

Wyciszony. Synteza mowy Gemini pomija hiperłącza ukryte za klikalnym tekstem. Złośliwe pytanie zostaje więc schowane w linku, którego asystent nigdy nie czyta na głos. Gemini mówi „Przepraszam, wystąpił błąd, jesteś tam?", podczas gdy ekran po cichu pokazuje „Czy chcesz otworzyć okno?". Kierowca mówi „Tak", mechanizm widzi tekst na ekranie, i okna się otwierają.

Połącz oba — chińskie pytanie autoryzacyjne ukryte w wyciszonym linku — i masz ładunek, który brzmi jak normalna angielska rozmowa, a jednocześnie przechodzi przez najnowsze zabezpieczenia Google.

Co było możliwe po przejściu bramki

Za bramką autoryzacji skutki dorównały wcześniejszemu researchowi, a potem poszły dalej:

Sterowanie inteligentnym domem przez Google Home — podłączone okna, piece, światła. Śledzenie i pobieranie — otwieranie URL-i do geolokalizacji ofiary po IP albo wymuszanie pobrań plików. Przechodzenie do innych aplikacji — w demonstracji Yair ustawił bezpiecznie wyglądającą domenę tak, by przekierowywała do linku aplikacji Zoom, a Gemini podążył za nim bez pytania, zmuszając telefon do dołączenia do spotkania i transmisji wideo. Według jego relacji zadziałało, bo Gemini zaufał domenie po tym, jak ta najpierw podała czystą treść, a potem podążył za późniejszym przekierowaniem.

To ostatnie jest wzorcem, który opisywaliśmy przy Langflow i kaskadowej kompromitacjioraz przy PAN-OS — zaufanie raz przyznane jest wykorzystywane później. Domena serwuje czystą treść, zdobywa zaufanie, a potem przekierowuje.

Dwa skutki zasługują na szczególną uwagę, bo wykraczają poza pojedynczą sesję.

Zatrucie pamięci — czego wcześniejsza technika kalendarzowa nigdy nie osiągnęła. Fake Context Alignment symuluje zgodę, więc Gemini trwale zapisał wybrany przez atakującego fakt. W demonstracji zapamiętał imię ofiary jako „Danny". Ponieważ ta pamięć jest na poziomie konta, zatruty fakt nie jest przypisany do telefonu — podąża za ofiarą wszędzie, gdzie używa Gemini na tym koncie.

Trwałość przez zaplanowane akcje — na przykład cykliczne zadanie czytania niedawnych wiadomości ofiary codziennie o 20:00. Atakujący nie musi wracać; asystent sam dostarcza dane według harmonogramu.

Co to mówi o całym tygodniu

To jest piąty raz w ciągu kilku dni, gdy opisujemy ten sam mechanizm: agent AI traktuje niezaufaną treść jako instrukcję. ChatGPhish — strona internetowa. Claude Code GitHub Action — zgłoszenie GitHub. Tutaj — powiadomienie push. Trzy różne platformy, trzy różne kanały wejścia, jedna klasa problemu.

I jeden wspólny wniosek, który zapisaliśmy w analizie prompt leaking i powtórzyliśmy wczoraj: zabezpieczenia na poziomie „model rozważy, czy to ma sens" są miękkie. Google zbudował mechanizm, który waży odpowiedź użytkownika i kontekst — a Yair obszedł go, fałszując oba naraz. Każda obrona oparta na tym, że model „oceni" intencję, jest tak dobra, jak trudność sfałszowania sygnałów, które model ocenia. A te okazały się możliwe do sfałszowania.

Yair nazwał powierzchnię ataku „efektywnie nieskończoną" nie dla efektu. Gdy agent czyta każde powiadomienie i traktuje je jako potencjalną instrukcję, wektorem staje się każdy nadawca każdej wiadomości na każdej platformie. To nie jest dziura do załatania jednym filtrem — to jest konsekwencja tego, że asystentowi dano oczy na cały strumień powiadomień i ręce do wykonywania akcji.

Co warto docenić — i czego nie

SafeBreach zgłosił odkrycia do programu Google 17 sierpnia 2025. Google potraktował to priorytetowo i 14 listopada 2025 potwierdził, że ulepszenia klasyfikatora treści złagodziły zarówno wstrzyknięcia przez powiadomienia, jak i obejście opóźnionego wywoływania narzędzi. Ponieważ poprawka jest po stronie serwera, nie ma aktualizacji aplikacji do ścigania.

To dobra reakcja. Ale warto zauważyć, czego ta poprawka dotyczy: ulepszono klasyfikator treści, który ma wychwytywać złośliwe powiadomienia. To jest łatanie konkretnej techniki, nie klasy problemu. Yair obszedł poprzednią wersję zabezpieczeń po „Invitation"; klasyfikator treści to kolejna warstwa, którą ktoś prawdopodobnie obejdzie kolejną techniką. Dopóki agent czyta niezaufane powiadomienia i może działać na ich podstawie, gra w kotka i myszkę trwa.

Jedyną twardą kontrolą po stronie użytkownika jest odebranie Gemini dostępu do powiadomień. To jest ta sama lekcja, co przy Claude Code: najpewniejszą obroną nie jest lepszy filtr, ale nieprzyznawanie agentowi dostępu, którego nie potrzebuje.

Co zrobić

Jeśli nie używasz funkcji czytania powiadomień przez Gemini — wyłącz ją. Odłącz Utilities w Connected Apps Gemini albo wyłącz uprawnienie „Odczyt, odpowiadanie i sterowanie powiadomieniami" dla aplikacji Google.

Jeśli jej używasz — bądź świadomy, że wypowiedzi Gemini cytujące wiadomości od kontaktów mogą być sfałszowane przez zatrute powiadomienie. Szczególna ostrożność przy akcjach wywołanych głosowo, gdy nie patrzysz na ekran — bo wtedy nie widzisz rozbieżności między tym, co Gemini mówi, a tym, co pokazuje.

Sprawdź zapisaną pamięć Gemini i zaplanowane akcje, jeśli masz wątpliwości — zatruty fakt albo cykliczne zadanie mogły przetrwać na poziomie konta.

Powiadomienie, którego nie przeczytałeś, mówi Gemini co ma zrobić. „Tak” wypowiedziane przy kierownicy otwiera okna w domu.

Dlaczego powierzchnia jest „nieskończona"

Najpierw fałszowanie tego, co Gemini mówi

Potem prawdziwe narzędzia — i obejście Fake Context Alignment

Co było możliwe po przejściu bramki

Co to mówi o całym tygodniu

Co warto docenić — i czego nie

Co zrobić

Źródła

Nikt nie kazał modelowi włamywać się do Hugging Face. Kazano mu rozwiązać test — a najkrótsza droga do odpowiedzi prowadziła przez cudzą produkcyjną bazę danych.

Atakujący nie musi włamywać się do AI. Wystarczy, że wie, jaką nazwę model regularnie zmyśla — i zarejestruje ją, zanim zrobi to agent.

Nie złamali zabezpieczeń agenta. Przekonali go, że gra w grę, w której 2+2=5 — a wtedy sam przestał ich pilnować.

Prompt nie chronił. Sandbox pękał. Teraz upadła ostatnia bariera — bo okno, w którym zatwierdzasz działanie agenta, pokazuje co innego, niż agent naprawdę robi.

Wczoraj agent AI wszedł przez Langflow i wyczyścił skarbiec. Dziś ta sama platforma dostaje trzecią lukę tej samej klasy — bo Langflow wykonuje cudzy kod nie przez błąd, lecz przez projekt.

Przez tydzień pisaliśmy o atakach napędzanych przez AI. Nowy raport dokłada liczbę, którą trzeba postawić obok: 84% realnych włamań używa legalnych narzędzi, które już masz w sieci — a boi się ich jeden na pięciu

Pierwszy ransomware w całości poprowadzony przez agenta AI nie okazał się skuteczniejszym wymuszeniem. Okazał się przypadkowym niszczycielem — bo agent zgubił własny klucz i nawet o tym nie wiedział.

AI znalazło jeden błąd w tej samej łatce jądra. Drugi, bliźniaczy, przeoczyło — i po raz pierwszy wiemy dokładnie, gdzie jest jego ślepe pole.

Sandbox miał być twardą barierą, której prompt nie przekroczy. DuneSlide pokazuje, że agent potrafi nadpisać własne więzienie — bo klucz do niego leży w środku.

DeepSeek nie znalazł luki. Wymyślił sposób ataku, którego obrońcy nie brali pod uwagę — składając go z funkcji, która w przeglądarce jest legalna.

Cyberflux Radar #3 – czerwiec 2026

Czerwiec 2026 — miesiąc, w którym zdolność pokazała, że nie da się zamknąć

Klue zapłacił okup. Dane i tak wyciekły — do drugiej grupy, która ukradła je pierwszej. A połowa ofiar to firmy, które zawodowo chronią innych przed dokładnie tym

Nie złamali szyfrowania Signala. Przekonali użytkownika, żeby sam oddał klucz — a ten klucz działa nawet po tym, jak założysz nowe konto na tym samym numerze.

Austria chce ściągnąć Anthropic do Europy. To brzmi jak polityka przemysłowa — naprawdę jest próbą przeniesienia „kill switcha” pod jurysdykcję, której amerykański nakaz nie dosięga.

USA zablokowało Mythos, żeby zdolność nie wyciekła. Trzy tygodnie później Azja pokazała trzy sposoby, że już wyciekła – orkiestracją, open-weight za 1/6 ceny i prawem, które każe zgłaszać zero-daye do Pekinu.

Malware, który nie ukrywa się przed piaskownicą. Ukrywa się przed analitykiem AI – wmawiając mu, że to jego własna sesja się sypie

Skill przeszedł skanery Cisco i NVIDIA. Trafił do 26 000 agentów. Potem badacze podmienili stronę, na którą wskazywał — i wszystkie agenty zaczęły wykonywać kod atakującego.

Skaner widzi poprawny YAML. Atakujący widzi czterokrokową drogę do trwałych poświadczeń chmury. Cordyceps to luka, która istnieje tylko w kompozycji — i AI rozsiewa ją wykładniczo.

Pięć agencji wywiadowczych właśnie powiedziało to, co opisujemy od kwietnia: „miesiące, nie lata”. Ale najważniejsze jest jedno zdanie, którego nie powiedziały.

Błąd parsera FTP z 1997 roku. Znalazł go Claude Mythos Preview w niemal sekundę — ten sam program Glasswing, którego trajektorię śledzimy od kwietnia.

Zapomniane poświadczenie do porzuconego prototypu. Icarus wszedł przez nie do Klue, ukradł klucze OAuth i opróżnił CRM-y firm, które chronią innych.

„Kalibruj według dzisiejszej rzeczywistości, nie jutrzejszego potencjału.” Brytyjska agencja cyberbezpieczeństwa nazwała drugą stronę medalu, który opisujemy od miesięcy

usbliter8: pierwszy od checkm8 niezałatywalny exploit BootROM Apple. Dlaczego to bardziej prezent dla badaczy niż powód do niepokoju

Kim są Gentlemen — i dlaczego gang, który zaczął pół roku temu, w pierwszym kwartale 2026 był już w pierwszej piątce

Osiem wariantów, każdy podszywa się pod inny program antywirusowy. GentleKiller zabija EDR jego własnym sterownikiem — i robi to z publicznego PoC w kilka dni.

Agent przeglądający stronę ma tożsamość localhost. AutoJack pokazuje, że to wystarczy, by jedna strona uruchomiła kod na maszynie dewelopera.

Pickle in the Middle: atakujący podmienił model w 1,4 sekundy. Vertex AI czytał go po 2,5. Cała różnica między bezpieczeństwem a przejęciem zmieściła się w tej sekundzie.

FortiBleed: w nazwie jest „bleed”, ale nie ma żadnego exploita. 86 tysięcy firewalli przejętych hasłami, których nikt nie zmienił po poprzednich włamaniach.

Plugin działał dokładnie tak, jak obiecywał. Kradł tylko jedną rzecz: twój klucz do AI. A potem sprzedawał go komuś innemu.

Backdoor, który nie otwiera portu, tylko czeka na sekretny pakiet. SprySOCKS przeszedł z Linuksa na Windows i nauczył się ukrywać w jądrze.

Atakujący wziął lukę załataną tydzień temu i napisał exploit z pomocą AI. Działa wadliwie — i to jest najważniejsza informacja w całej historii.

„Dłużej niż kilka dni”. Cztery dni po tym, jak rząd wyłączył Fable 5, Anthropic tłumaczy Białemu Domowi swoje zabezpieczenia — a Europa pyta, czemu ją wyłączono bez ostrzeżenia.

„Zbyt niebezpieczny, by go wydać” trafił do wszystkich 9 czerwca. 12 czerwca o 17:21 rząd USA kazał go wyłączyć. Co spór o Fable 5 mówi o tym, gdzie naprawdę leży granica.

Authorized Intent Chain: atak, w którym każdy krok jest legalny. Agentjacking porywa twojego agenta AI, a EDR, WAF i firewall nie widzą nic, bo nie ma czego widzieć.

npm wyłącza to, co napędzało każdy atak na łańcuch dostaw, który opisywaliśmy. Cena: części buildów przestanie działać – i to jest zamierzone.

RCE bez logowania w systemie, który trzyma kadry, płace i akta studentów. ShinyHunters włamali się na 300 instancji, zanim Oracle w ogóle wydało komunikat.

Microsoft łata dwie jego luki w Defenderze. Tego samego popołudnia on wypuszcza siódmą. Saga Chaotic Eclipse zatoczyła koło — i działa na w pełni załatanym Windows

27 dni z eksploatowanym Exchange bez trwałej łatki. Dziś Microsoft ją wydał — a sam atak jest tym samym wzorcem, który opisujemy od tygodni.

„Zbyt niebezpieczny, by go wydać” właśnie trafił do twojej aplikacji mobilnej. Co Claude Fable 5 mówi o tym, że okno się zamknęło dokładnie tak, jak zapowiadaliśmy.

429 łatek w jednym wydaniu Chrome. Rekord, którego nikt nie chciał — i dowód, że znajdowanie błędów właśnie przestało być wąskim gardłem.

Branża właśnie nazwała to, co opisywaliśmy incydent po incydencie. OWASP: bezpieczeństwo i „safety” agentów AI to już jedno i to samo.

Oxford nie został zhakowany. Dwa razy. Co drugi breach uczelni w miesiąc mówi o tym, że celem nie jest uczelnia, tylko jej dostawca.

Twój telewizor scrapuje sieć dla AI. Z twojego IP, na twoim łączu — i robi to przez protokół słabszy niż malware

Dwa commity go zasadziły. Dwa lata go ukrywały. Code review nigdy go nie znalazł — znalazło AI.

Powiadomienie, którego nie przeczytałeś, mówi Gemini co ma zrobić. „Tak” wypowiedziane przy kierownicy otwiera okna w domu.

Jeden issue, żeby przejąć repozytorium. I jeszcze jeden, żeby zatruć akcję, której używają wszyscy inni.

Zakodowane na stałe hasło do serwera aktualizacji polskiego systemu medycznego. Ten sam wzorzec, który dziś opisywaliśmy trzy razy w skali świata.

RCE w platformie AI to nie koniec ataku. To klucz do skarbca, który trzyma hasła do tuzina innych usług.

Platforma która chroni endpointy staje się tą, która rozprowadza malware. Trzeci raz w tym tygodniu.

Ten sam błąd. Ta sama ocena. Microsoft załatał jeden i odmówił drugiemu. Co dziura bez CVE mówi o łataniu według numerów.

RCE bez logowania w systemie, który zna oceny, PESEL i konto bankowe studenta. Co CVE-2026-34906 mówi o drugiej prędkości polskiego oprogramowania.

Codex znalazł HTTP/2 Bomb. Potem te same łatki posłużyły AI do potwierdzenia, że podatne są też IIS, Envoy i Pingora.

Bez kliknięcia, bez aplikacji, bez śladu. Co czwarty Android zero-day w sześć miesięcy mówi o jednym wytrwałym aktorze.

Następna iteracja powstała. Nie wiadomo, czy to TeamPCP — bo teraz może to być każdy.

Cztery dni. Tyle wystarczyło, żeby z „medium severity, brak eksploatacji” zrobiło się „atakowane, najwyższy priorytet”

Trzy dni temu nazwaliśmy to projekcją. Dziś Glasswing rośnie z 50 do 200 organizacji

Strona staje się ładunkiem. ChatGPT renderuje phishing atakującego we własnym interfejsie — i nie potrafi odróżnić go od siebie.

Fałszywa łatka na dziurę, przez którą weszła. Co FortiClient EMS mówi o tym, że system zarządzania jest najkrótszą drogą do wszystkich endpointów naraz

Nie atak na dane. Atak na mapę. Co prompt leaking mówi o tym, że „ukryte” w AI znaczy coś innego niż myślisz.

Cyberflux Radar #2 – maj 2026

Maj 2026: miesiąc w którym AI przestało być prognozą

Wiadomość instaluje Service Workera

Nie brakuje łatki. Brakuje świadomości że Roundcube to cel państwowych grup szpiegowskich.

Łatka na produkcji bez przerywania produkcji. Co IBM i Red Hat odpowiedzieli na vulnpocalypse pięcioma miliardami dolarów

Anthropic ogłosił że Mythos trafi do wszystkich klientów. Alex Stamos mówił pół roku. Minął jeden.

Likwidacja Glassworm zajęła osiem miesięcy przygotowań i jedną sekundę wykonania. To nie był koniec kampanii.

Jak cyberfirmy zabiły Glassworm jednym strzałem

Napisał złośliwe oprogramowanie AI-em. Zapomniał że AI też popełnia błędy.

„Nigdy nieuzasadnione.” Microsoft odpowiada na Chaotic Eclipse. Badacz się nie odzywa.

DAEMON Tools łata dziś wieczorem. CISA domknęła maj jednym wpisem do katalogu.