Opus 4.8 - nowy flagowy model AI od Anthropic

Anthropic ogłosił 28 maja 2026 premierę Claude Opus 4.8, czwartą iterację flagowego modelu od listopada 2025. Premiera ma trzy nazwy do zapamiętania: Dynamic Workflows w Claude Code, trzy razy tańszy szybki tryb oraz effort control z trzema poziomami pracy. Co więcej, ceny standardowe się nie ruszyły. Na sześciu kluczowych benchmarkach nowy Opus prowadzi na pięciu. Z kolei Bridgewater Associates jako wczesny tester chwali model za samodzielne flagowanie wątpliwości w analizach. Większy model klasy frontier, znany jako Mythos, ma trafić do klientów w najbliższych tygodniach.

Co dokładnie dostajemy w Opus 4.8

Nowy model jest dostępny od dnia premiery na Claude.ai, w Claude API, na AWS Bedrock, Google Vertex AI, Microsoft Foundry oraz w GitHub Copilot. Identyfikator w API to claude-opus-4-8. W Claude Code wystarczy wpisać /model claude-opus-4-8, żeby agent przeskoczył na nowszą wersję. Z kolei context window został bez zmian względem Opus 4.7 – milion tokenów wejścia i 128 tysięcy tokenów wyjścia.

Anthropic opisuje sam model jako wersję z “ostrzejszym osądem, większą szczerością wobec własnych postępów i dłuższą zdolnością do samodzielnej pracy”. To nie jest pusta deklaracja. Mianowicie w oficjalnych testach producenta Opus 4.8 jest “około cztery razy mniej skłonny niż jego poprzednik do pozostawienia bez komentarza wad we własnym kodzie”. Cytat brzmi mocno, jednak warto pamiętać, że to wewnętrzna metryka Anthropic, bez audytu zewnętrznego.

Z perspektywy codziennej pracy najbardziej widać dwie zmiany. Pierwsza dotyczy fast mode. Szybki tryb kosztuje teraz trzy razy mniej niż wcześniej – 10 dolarów za milion tokenów wejścia i 50 dolarów za milion wyjścia, zamiast 30 i 150 dolarów w poprzedniej wersji. Druga zmiana to effort control. Jest to nowa kontrolka obok wyboru modelu, która pozwala wybrać poziom wysiłku Claude’a w odpowiedzi. Anthropic wymienia trzy poziomy: high (domyślny), extra (xhigh w Claude Code) oraz max. Wyższy poziom oznacza więcej tokenów rozumowania i większy koszt. Natomiast domyślny high daje szybszą odpowiedź za mniej.

Dynamic Workflows w Claude Code – setki subagentów w jednej sesji

Najbardziej rozpoznawalna nowość premiery to Dynamic Workflows. Anthropic oficjalnie udostępnia ją w trybie research preview w Claude Code, na planach Enterprise, Team i Max. W praktyce funkcja pozwala Claude’owi zaplanować większe zadanie. Następnie odpala setki równoległych subagentów w jednej sesji. W rezultacie sam weryfikuje wyniki, zanim zwróci raport.

Reklamowany przykład jest konkretny: “codebase-scale migrations across hundreds of thousands of lines of code from kickoff to merge, with the existing test suite as its bar”. W tłumaczeniu własnym: migracje na skalę całego repozytorium, setki tysięcy linii kodu od startu do merge’a, z istniejącym zestawem testów jako poprzeczką. Dla zespołów dewelopersko-utrzymaniowych to znacznie inny tryb pracy niż klasyczny dialog z asystentem. Co więcej, Claude tutaj nie pisze pojedynczego patcha. Zamiast tego prowadzi pracownię równoległych instancji i dopiero końcówkę przekazuje człowiekowi.

Claude tutaj nie pisze pojedynczego patcha, lecz prowadzi pracownię równoległych instancji i dopiero końcówkę przekazuje człowiekowi.

W polskich realiach Dynamic Workflows zaczyna być argumentem przy konkretnych projektach. Migracja repozytorium z Javy 8 do 21, AngularJS do React albo PHP 5 do PHP 8 to dziś typowo projekt na kilka tygodni dla małego zespołu. Setki równoległych subagentów teoretycznie mogą przerobić znaczną część w tle, jeśli istniejący suite testów jest dostatecznie szczelny. Teoretycznie, ponieważ jest to research preview i Anthropic nie zobowiązuje się do utrzymania funkcji w obecnej formie.

Benchmarki: nowy lider na pięciu z sześciu testów

W oficjalnej tabeli porównawczej Anthropic stawia nowy model obok Opus 4.7, GPT-5.5 oraz Gemini 3.1 Pro na sześciu benchmarkach. Wyniki czyta się jednoznacznie. Na agentic coding (SWE-Bench Pro) Opus 4.8 osiąga 69,2%, podczas gdy poprzednik miał 64,3%, GPT-5.5 ma 58,6%, a Gemini 3.1 Pro 54,2%. To największa poprawa generacyjna w serii Opus 4. Z kolei w agentic computer use (OSWorld-Verified) nowy model osiąga 83,4% wobec 82,3% poprzednika (po aktualizacji oficjalnej tabeli Anthropic), 78,7% GPT-5.5 i 76,2% Gemini 3.1 Pro.

Knowledge work mierzony GDPval-AA daje Opus 4.8 1890 punktów Elo, podczas gdy GPT-5.5 1769, a Gemini 3.1 Pro 1314. To wyraźna przewaga nad GPT-5.5 i duża nad Gemini. Z kolei multidisciplinary reasoning w Humanity’s Last Exam z narzędziami daje nowemu modelowi 57,9%, co czyni go najlepszym w stawce. Analiza finansowa mierzona Finance Agent v2 to z kolei 53,9%, czyli lekko nad GPT-5.5 (51,8%) i wyraźnie nad Gemini 3.1 Pro (43,0%).

Jeden numer jest jednak inny. Terminal-Bench 2.1, czyli ocena pracy w terminalu, daje Opus 4.8 wynik 74,6%. To skok o 8,5 punktu względem 4.7 (66,1%). Tymczasem GPT-5.5 osiąga w tym samym teście 78,2%. Jedyny benchmark w tej tabeli, w którym konkurent prowadzi. Dla zespołów żyjących w terminalu i korzystających z Claude Code lub Codex CLI to praktyczna informacja. Opus 4.8 jest wyraźnie szybszy niż poprzednik w tym scenariuszu, ale GPT-5.5 nadal prowadzi.

Cytat od wczesnego testera dodaje kontekstu do narracji “honesty”. Michael Ran z Bridgewater Associates powiedział TechCrunchowi, że największa różnica to “Opus 4.8’s tendency to proactively flag issues with the inputs and outputs of an analysis”. W tłumaczeniu własnym: tendencja Opus 4.8 do samodzielnego flagowania problemów z danymi wejściowymi i wynikami analizy. Co więcej, inne modele rutynowo pomijały takie problemy. Użytkownik musiał wtedy łapać je sam.

Kurs n8n 2.0 · Kodożercy

Od zera do własnych automatyzacji, bez doświadczenia

Kurs n8n 2.0 od Kodożerców przeprowadzi Cię krok po kroku przez budowanie prawdziwych automatyzacji. Od webhooków, przez integracje z API, po własne przepływy danych – wszystko bez programowania.

Sprawdź kurs n8n 2.0 →

Ceny, plany i co dalej z Mythos

Pricing standardowy i tańszy fast mode

Ceny standardowe Opus 4.8 są takie same jak u poprzednika – 5 dolarów za milion tokenów wejścia i 25 dolarów za milion wyjścia. Co więcej, Anthropic dorzuca obniżki znane z poprzedniej wersji: do 90% taniej dzięki prompt caching i 50% taniej przy batch processing. Z kolei fast mode kosztuje teraz 10 i 50 dolarów. To trzy razy taniej niż wcześniej (30/150). W efekcie dla zespołów płacących za API w narzędziach jak Cursor, Windsurf czy Zed jest to realna zmiana rachunku.

Co dostaje który plan Claude.ai

Dla użytkowników planów subskrypcyjnych Claude.ai układ jest następujący. Sam model Opus 4.8 trafia od dnia premiery do Pro, Max, Team i Enterprise. Z kolei Dynamic Workflows w Claude Code w trybie research preview są oficjalnie dostępne dla Enterprise, Team i Max. Effort control działa w claude.ai i Cowork na wszystkich planach z dostępem do Opus 4.8. W efekcie polski deweloper, który dotąd pracował na Claude Pro, może dziś rano otworzyć Claude Code i wpisać komendę /model claude-opus-4-8. Dostaje nowy model w niezmienionej cenie.

Runda 65 miliardów i zapowiedź Mythosa

Częścią szerszej premiery jest też kontekst biznesowy. Tego samego dnia Anthropic ogłosił rundę Series H na 65 miliardów dolarów przy wycenie 965 miliardów dolarów. W rundzie wzięli udział Altimeter, Dragoneer, Greenoaks oraz Sequoia. Annualized run rate firmy podany w komunikacie to 47 miliardów dolarów. Dwie liczby w jednym poście prasowym mówią inwestorom jedno – zaufanie rośnie i zaufanie się opłaca.

Najciekawszą zapowiedzią dalej jest Mythos. Anthropic deklaruje, że Mythos Preview działa już u wąskiej grupy organizacji w testach cybersecurity. Ogólne udostępnienie ma nastąpić “w najbliższych tygodniach”. Firma pisze w oficjalnym komunikacie, że deception rates w Opus 4.8 są już “bliskie Claude Mythos Preview”. W efekcie nowy flagowiec ma być pierwszym serwowanym powszechnie modelem klasy zbliżonej do tego, co rozwija się w zamkniętych zespołach Anthropic. Pełniejsze tło wokół poprzedniej wersji opisaliśmy w tekście o Opus 4.7 w Google Vertex AI dla polskich firm. Po dzisiejszej premierze wiele z tych obserwacji nadal się broni, jednak rytm aktualizacji wyraźnie przyspieszył.

Podsumowanie

Claude Opus 4.8 jest premierą inkrementalną pod względem ceny i ogólnej oferty, jednak z trzema konkretnymi nowościami w środku. Pierwsza warstwa to lepsze wyniki na pięciu z sześciu kluczowych benchmarków oraz wyraźny skok SWE-Bench Pro. Druga warstwa to Dynamic Workflows w Claude Code – setki równoległych subagentów dla zespołów na planach Enterprise, Team oraz Max. Trzecia warstwa to fast mode trzy razy tańszy plus effort control jako narzędzie do strojenia kosztu i jakości odpowiedzi. Tego samego dnia padły także liczby biznesowe: 65 miliardów dolarów świeżego kapitału przy wycenie 965 miliardów oraz zapowiedź Mythosa w najbliższych tygodniach. Dla użytkowników to dzień, w którym warto zaktualizować skróty w Claude Code. Następnie warto sprawdzić, jak zachowuje się effort control na typowym zadaniu. Dopiero potem warto zdecydować, czy nowy szybki tryb zmienia coś w rachunku za API.

Newsletter · DevstockAcademy & Kodożercy

Bądź na bieżąco ze światem IT, AI i automatyzacji

Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.

Mateusz Wojdalski

Specjalista SEO i content marketingu w Devstock. Zajmuję się strategią treści, automatyzacją procesów marketingowych i wdrożeniami AI w codziennej pracy. Badam nowe narzędzia, adaptuję je do realnych zadań i piszę o tym, co faktycznie działa.

Claude Opus 4.8 – co przynosi nowy flagowy model Anthropic

Co dokładnie dostajemy w Opus 4.8

Dynamic Workflows w Claude Code – setki subagentów w jednej sesji

Benchmarki: nowy lider na pięciu z sześciu testów

Od zera do własnych automatyzacji, bez doświadczenia