Cztery dni temu Mozilla pokazała sukces. 271 luk w Firefoxie znalezionych przez Claude Mythos Preview. Dziś, 11 maja 2026, Daniel Stenberg, twórca i główny opiekun biblioteki curl zainstalowanej w ponad 20 miliardach urządzeń, publikuje wpis z dużo chłodniejszym tonem. Ten sam model AI dostał na audyt 178 tysięcy linii kodu curl. Zwrócił raport z pięcioma zgłoszeniami luk bezpieczeństwa. Po weryfikacji zespołu curl zostało z tego dokładnie jedno trafienie, i to o niskiej ważności. Stenberg pisze wprost, że dotychczasowy szum wokół tego modelu to głównie marketing. Dla wszystkich, którzy patrzą na AI w bezpieczeństwie, to bardzo ważne uziemienie.
Co dokładnie znalazł Claude Mythos w curl
Stenberg dostał skan poprzez program Linux Foundation Alpha Omega, dlatego trafił do testowej puli Anthropic Project Glasswing. Po początkowym opóźnieniu skan przeprowadziła zewnętrzna osoba metodą ręcznej analizy z pomocniczymi modelami AI w tle. W praktyce wygląda to tak, że człowiek prowadzi audyt, a Claude Mythos czyta równolegle pliki kodu i zwraca kandydatów na podejrzane miejsca. Każdy taki kandydat trafia potem do bezpośredniej inspekcji źródła.
Skan objął katalogi src/ i lib/, łącznie 178 tysięcy linii czystego C. Cały kod curl to dziś około 176 tysięcy linii (bez pustych wierszy), w efekcie audyt sięgnął praktycznie całej bazy. Raport zawierał blisko 20 opisanych błędów. Z tego 5 oznaczono jako kandydatów na luki bezpieczeństwa. Po analizie zespołu curl liczba realnych luk spadła natomiast do jednej.
Pozostałe cztery? Stenberg opisuje to chirurgicznie. Trzy zgłoszenia okazały się udokumentowanym zachowaniem API, czyli intencjonalną pracą biblioteki, a nie żadną luką. Czwarte to z kolei zwykły bug, który nie miał znaczenia dla bezpieczeństwa. Realna luka jest na poziomie “Low” i ma trafić do publikacji wraz z wersją curl 8.21.0 w czerwcu 2026. Szczegóły CVE Stenberg ujawni natomiast dopiero przy łatce, więc dziś trzeba poczekać.
178 tysięcy linii kodu C, 5 kandydatów na luki, 1 realna luka. To jest twarda metryka, którą można zestawiać z innymi modelami.
Dlaczego Stenberg studzi entuzjazm
Stenberg zwykle nie strzela z biodra, kiedy chodzi o narzędzia security. Co więcej, jego zespół przepuszcza curl przez kilka różnych narzędzi AI od ponad roku. Wcześniej curl był już skanowany narzędziami AISLE, Zeropath i OpenAI Codex Security. Według Stenberga przez ostatnie 8-10 miesięcy dały one łącznie 200-300 poprawek, z czego część została opublikowana jako CVE.
W tym kontekście jedno trafienie o niskiej ważności po skanie 178 tysięcy linii to słaby wynik. Dlatego Stenberg nazywa dotychczasową narrację wokół tego modelu marketingową fanfarą bez pokrycia. Z drugiej strony nie odrzuca samej idei. Zapisuje wprost, że narzędzia AI do analizy kodu są “znacząco lepsze” niż klasyczne statyczne analizatory (typu coverity, cppcheck), a projekt, który ich nie używa, daje atakującym fory. Co więcej, Stenberg chce kolejnych skanów Mythos w curl, mimo że ten pierwszy nie zachwycił.
To istotny niuans dla każdego, kto czyta dzisiaj nagłówki “AI znalazł 271 luk w Firefoxie” i myśli, że za tydzień model pójdzie na każdy projekt open source z podobnym wynikiem. Cztery z pięciu zgłoszeń nie były realnymi lukami: trzy okazały się fałszywymi alarmami, a jedno zwykłym bugiem bez wpływu na bezpieczeństwo. Dla małego zespołu open source, który nie ma czasu rozważać każdej hipotezy modelu, to wciąż jest spory koszt.
Dlaczego Mozilla i Stenberg dostali tak różne wyniki
Mozilla pisała o 271 lukach w jednej wersji Firefoxa, Stenberg natomiast o jednej w całym curl. Stąd biorą się trzy różnice, o których warto pamiętać.
Po pierwsze, baza kodu. Firefox to setki tysięcy linii C++ z mnóstwem podsystemów, takich jak parser HTML, silnik JIT, komunikacja między procesami, sandbox (czyli izolowane środowisko dla każdej zakładki), baza IndexedDB. Co więcej, każdy z nich ma własne, znane klasy błędów: użycie zwolnionej pamięci, przepełnienia liczb całkowitych, wyścigi wątków. Curl to natomiast bardzo dobrze ułożona biblioteka HTTP, z wąską powierzchnią ataku i mocnym pokryciem testami. Innymi słowy, w Firefoxie dużo łatwiej jest “wyhaczyć” coś nowego niż w curl.
Po drugie, proces. Mozilla zbudowała proces audytu, w którym AI proponuje, a fuzzing (testowanie programu losowymi danymi wejściowymi) weryfikuje każdego kandydata zanim trafi do raportu człowieka. Stenberg dostał z kolei skan ręczny, gdzie człowiek prowadzi i weryfikuje wszystko sam. Dlatego u Mozilli fałszywe alarmy nie obciążają zespołu, bo nigdy do niego nie docierają. U Stenberga obciążają, ponieważ to on i jego ludzie sprawdzają każde zgłoszenie.
Po trzecie, doświadczenie zespołu. Mozilla wprost pisze, że dopracowała prompty i klasyfikatory przez miesiące. Audyt curl to pierwsza próba na tym konkretnym projekcie. To jak różnica między pierwszą jazdą próbną a wyścigiem – to samo auto, zupełnie inny wynik.
Mozilla zbudowała proces, w którym false positives umierają zanim dotrą do człowieka. Stenberg dostał raport bez tego filtra.
Co to znaczy dla utrzymujących open source
Wniosek dla typowego opiekuna otwartego projektu jest prosty. AI w audycie kodu działa, ale wymaga inwestycji w proces, nie tylko dostępu do modelu. Jeden skan zewnętrznego skanera niekoniecznie da spektakularne wyniki, zwłaszcza w projekcie, który już ma fuzzing i solidne testy. Stenberg sam pisze, że bez AI atakujący zyskują czas, więc warto. Ale traktowanie pierwszego skanu jako wyroku to błąd.
Dla polskich zespołów wniosek praktyczny: jeśli rozważacie AI w bezpieczeństwie, zacznijcie od jasnego pytania – co konkretnie ma znajdować skan, w którym module, z jakim filtrem fałszywych alarmów. Skopiowanie metody Mozilli (AI plus automatyczne testy w jednym procesie) jest droższe niż wynajęcie konsultanta na pojedynczy audyt, ale daje powtarzalne wyniki. Skopiowanie metody Stenberga (ręczna analiza z pomocniczymi modelami) jest tańsze, ale efekty zależą od tego, kto i jak prowadzi.
To jak nowy lekarz w szpitalu. Dyplom robi wrażenie, ale dopóki nie zobaczysz, jak działa na konkretnym oddziale, nie wiesz, czy uratuje pacjenta. Mythos w Firefoxie ratuje, w curl – nie tym razem. Następny skan może wyglądać inaczej.
Kurs n8n 2.0 · Kodożercy
n8n + AI = automatyzacje, które naprawdę myślą
n8n pozwala podłączyć modele AI do swoich workflow – wysyłać dane do Claude’a, analizować wyniki, reagować automatycznie. Kurs n8n 2.0 na Kodożercach pokaże Ci, jak to połączyć – bez przepychania promptów ręcznie.
Sprawdź jak to działa →

Podsumowanie
Stenberg dał branży coś, czego brakowało po fali entuzjastycznych nagłówków: chłodną, weryfikowalną liczbę. 5 zgłoszeń, 1 luka. Mythos zadziałał. Znalazł coś, czego nie złapali ani fuzzing, ani poprzednie narzędzia AI. Jednak efekt jest dużo bardziej kameralny niż w Mozilli. Co dla nas? AI w audycie open source to nie magia. To narzędzie, którego skuteczność zależy od projektu, procesu oraz doświadczenia zespołu. Pełniejszą perspektywę dwóch równoległych historii Claude Mythos w security daje Mozilla z Claude Mythos – 271 luk w Firefoxie 150.
Newsletter · DevstockAcademy & Kodożercy
Bądź na bieżąco ze światem IT, AI i automatyzacji
Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.



