Skip to content
devstock logo
  • O nas
  • Moduły Akademii
    • Moduł 1
    • Moduł 2
    • Moduł 3
    • Pozostałe moduły
  • Kursy AI i IT
    • Pierwsza Misja AI (Podstawy)
    • Automatyzacje z n8n 2.0
    • Frontend Master 2026
  • Blog
  • Kontakt
  • O nas
  • Moduły Akademii
    • Moduł 1
    • Moduł 2
    • Moduł 3
    • Pozostałe moduły
  • Kursy AI i IT
    • Pierwsza Misja AI (Podstawy)
    • Automatyzacje z n8n 2.0
    • Frontend Master 2026
  • Blog
  • Kontakt
Kurs Automatyzacji z n8n - banner reklamowy
Branża IT i Nowe Technologie

Claude Opus 4.8 – co przynosi nowy flagowy model Anthropic

  • 29 maj, 2026
  • Komentarze 0
Cinematic reveal nowego flagowego modelu Claude Opus 4.8 od Anthropic, w centrum hasło "Nowy Opus startuje". Premiera Opus 4.8.

Anthropic ogłosił 28 maja 2026 premierę Claude Opus 4.8, czwartą iterację flagowego modelu od listopada 2025. Premiera ma trzy nazwy do zapamiętania: Dynamic Workflows w Claude Code, trzy razy tańszy szybki tryb oraz effort control z trzema poziomami pracy. Co więcej, ceny standardowe się nie ruszyły. Na sześciu kluczowych benchmarkach nowy Opus prowadzi na pięciu. Z kolei Bridgewater Associates jako wczesny tester chwali model za samodzielne flagowanie wątpliwości w analizach. Większy model klasy frontier, znany jako Mythos, ma trafić do klientów w najbliższych tygodniach.

Co dokładnie dostajemy w Opus 4.8

Nowy model jest dostępny od dnia premiery na Claude.ai, w Claude API, na AWS Bedrock, Google Vertex AI, Microsoft Foundry oraz w GitHub Copilot. Identyfikator w API to claude-opus-4-8. W Claude Code wystarczy wpisać /model claude-opus-4-8, żeby agent przeskoczył na nowszą wersję. Z kolei context window został bez zmian względem Opus 4.7 – milion tokenów wejścia i 128 tysięcy tokenów wyjścia.

Anthropic opisuje sam model jako wersję z “ostrzejszym osądem, większą szczerością wobec własnych postępów i dłuższą zdolnością do samodzielnej pracy”. To nie jest pusta deklaracja. Mianowicie w oficjalnych testach producenta Opus 4.8 jest “około cztery razy mniej skłonny niż jego poprzednik do pozostawienia bez komentarza wad we własnym kodzie”. Cytat brzmi mocno, jednak warto pamiętać, że to wewnętrzna metryka Anthropic, bez audytu zewnętrznego.

Z perspektywy codziennej pracy najbardziej widać dwie zmiany. Pierwsza dotyczy fast mode. Szybki tryb kosztuje teraz trzy razy mniej niż wcześniej – 10 dolarów za milion tokenów wejścia i 50 dolarów za milion wyjścia, zamiast 30 i 150 dolarów w poprzedniej wersji. Druga zmiana to effort control. Jest to nowa kontrolka obok wyboru modelu, która pozwala wybrać poziom wysiłku Claude’a w odpowiedzi. Anthropic wymienia trzy poziomy: high (domyślny), extra (xhigh w Claude Code) oraz max. Wyższy poziom oznacza więcej tokenów rozumowania i większy koszt. Natomiast domyślny high daje szybszą odpowiedź za mniej.

Dynamic Workflows w Claude Code – setki subagentów w jednej sesji

Najbardziej rozpoznawalna nowość premiery to Dynamic Workflows. Anthropic oficjalnie udostępnia ją w trybie research preview w Claude Code, na planach Enterprise, Team i Max. W praktyce funkcja pozwala Claude’owi zaplanować większe zadanie. Następnie odpala setki równoległych subagentów w jednej sesji. W rezultacie sam weryfikuje wyniki, zanim zwróci raport.

Reklamowany przykład jest konkretny: “codebase-scale migrations across hundreds of thousands of lines of code from kickoff to merge, with the existing test suite as its bar”. W tłumaczeniu własnym: migracje na skalę całego repozytorium, setki tysięcy linii kodu od startu do merge’a, z istniejącym zestawem testów jako poprzeczką. Dla zespołów dewelopersko-utrzymaniowych to znacznie inny tryb pracy niż klasyczny dialog z asystentem. Co więcej, Claude tutaj nie pisze pojedynczego patcha. Zamiast tego prowadzi pracownię równoległych instancji i dopiero końcówkę przekazuje człowiekowi.

Claude tutaj nie pisze pojedynczego patcha, lecz prowadzi pracownię równoległych instancji i dopiero końcówkę przekazuje człowiekowi.

W polskich realiach Dynamic Workflows zaczyna być argumentem przy konkretnych projektach. Migracja repozytorium z Javy 8 do 21, AngularJS do React albo PHP 5 do PHP 8 to dziś typowo projekt na kilka tygodni dla małego zespołu. Setki równoległych subagentów teoretycznie mogą przerobić znaczną część w tle, jeśli istniejący suite testów jest dostatecznie szczelny. Teoretycznie, ponieważ jest to research preview i Anthropic nie zobowiązuje się do utrzymania funkcji w obecnej formie.

Benchmarki: nowy lider na pięciu z sześciu testów

W oficjalnej tabeli porównawczej Anthropic stawia nowy model obok Opus 4.7, GPT-5.5 oraz Gemini 3.1 Pro na sześciu benchmarkach. Wyniki czyta się jednoznacznie. Na agentic coding (SWE-Bench Pro) Opus 4.8 osiąga 69,2%, podczas gdy poprzednik miał 64,3%, GPT-5.5 ma 58,6%, a Gemini 3.1 Pro 54,2%. To największa poprawa generacyjna w serii Opus 4. Z kolei w agentic computer use (OSWorld-Verified) nowy model osiąga 83,4% wobec 82,3% poprzednika (po aktualizacji oficjalnej tabeli Anthropic), 78,7% GPT-5.5 i 76,2% Gemini 3.1 Pro.

Knowledge work mierzony GDPval-AA daje Opus 4.8 1890 punktów Elo, podczas gdy GPT-5.5 1769, a Gemini 3.1 Pro 1314. To wyraźna przewaga nad GPT-5.5 i duża nad Gemini. Z kolei multidisciplinary reasoning w Humanity’s Last Exam z narzędziami daje nowemu modelowi 57,9%, co czyni go najlepszym w stawce. Analiza finansowa mierzona Finance Agent v2 to z kolei 53,9%, czyli lekko nad GPT-5.5 (51,8%) i wyraźnie nad Gemini 3.1 Pro (43,0%).

Jeden numer jest jednak inny. Terminal-Bench 2.1, czyli ocena pracy w terminalu, daje Opus 4.8 wynik 74,6%. To skok o 8,5 punktu względem 4.7 (66,1%). Tymczasem GPT-5.5 osiąga w tym samym teście 78,2%. Jedyny benchmark w tej tabeli, w którym konkurent prowadzi. Dla zespołów żyjących w terminalu i korzystających z Claude Code lub Codex CLI to praktyczna informacja. Opus 4.8 jest wyraźnie szybszy niż poprzednik w tym scenariuszu, ale GPT-5.5 nadal prowadzi.

Cytat od wczesnego testera dodaje kontekstu do narracji “honesty”. Michael Ran z Bridgewater Associates powiedział TechCrunchowi, że największa różnica to “Opus 4.8’s tendency to proactively flag issues with the inputs and outputs of an analysis”. W tłumaczeniu własnym: tendencja Opus 4.8 do samodzielnego flagowania problemów z danymi wejściowymi i wynikami analizy. Co więcej, inne modele rutynowo pomijały takie problemy. Użytkownik musiał wtedy łapać je sam.

Kurs n8n 2.0 · Kodożercy

Od zera do własnych automatyzacji, bez doświadczenia

Kurs n8n 2.0 od Kodożerców przeprowadzi Cię krok po kroku przez budowanie prawdziwych automatyzacji. Od webhooków, przez integracje z API, po własne przepływy danych – wszystko bez programowania.

Sprawdź kurs n8n 2.0 →
Kurs n8n 2.0 - Kodożercy

Ceny, plany i co dalej z Mythos

Pricing standardowy i tańszy fast mode

Ceny standardowe Opus 4.8 są takie same jak u poprzednika – 5 dolarów za milion tokenów wejścia i 25 dolarów za milion wyjścia. Co więcej, Anthropic dorzuca obniżki znane z poprzedniej wersji: do 90% taniej dzięki prompt caching i 50% taniej przy batch processing. Z kolei fast mode kosztuje teraz 10 i 50 dolarów. To trzy razy taniej niż wcześniej (30/150). W efekcie dla zespołów płacących za API w narzędziach jak Cursor, Windsurf czy Zed jest to realna zmiana rachunku.

Co dostaje który plan Claude.ai

Dla użytkowników planów subskrypcyjnych Claude.ai układ jest następujący. Sam model Opus 4.8 trafia od dnia premiery do Pro, Max, Team i Enterprise. Z kolei Dynamic Workflows w Claude Code w trybie research preview są oficjalnie dostępne dla Enterprise, Team i Max. Effort control działa w claude.ai i Cowork na wszystkich planach z dostępem do Opus 4.8. W efekcie polski deweloper, który dotąd pracował na Claude Pro, może dziś rano otworzyć Claude Code i wpisać komendę /model claude-opus-4-8. Dostaje nowy model w niezmienionej cenie.

Runda 65 miliardów i zapowiedź Mythosa

Częścią szerszej premiery jest też kontekst biznesowy. Tego samego dnia Anthropic ogłosił rundę Series H na 65 miliardów dolarów przy wycenie 965 miliardów dolarów. W rundzie wzięli udział Altimeter, Dragoneer, Greenoaks oraz Sequoia. Annualized run rate firmy podany w komunikacie to 47 miliardów dolarów. Dwie liczby w jednym poście prasowym mówią inwestorom jedno – zaufanie rośnie i zaufanie się opłaca.

Najciekawszą zapowiedzią dalej jest Mythos. Anthropic deklaruje, że Mythos Preview działa już u wąskiej grupy organizacji w testach cybersecurity. Ogólne udostępnienie ma nastąpić “w najbliższych tygodniach”. Firma pisze w oficjalnym komunikacie, że deception rates w Opus 4.8 są już “bliskie Claude Mythos Preview”. W efekcie nowy flagowiec ma być pierwszym serwowanym powszechnie modelem klasy zbliżonej do tego, co rozwija się w zamkniętych zespołach Anthropic. Pełniejsze tło wokół poprzedniej wersji opisaliśmy w tekście o Opus 4.7 w Google Vertex AI dla polskich firm. Po dzisiejszej premierze wiele z tych obserwacji nadal się broni, jednak rytm aktualizacji wyraźnie przyspieszył.

Podsumowanie

Claude Opus 4.8 jest premierą inkrementalną pod względem ceny i ogólnej oferty, jednak z trzema konkretnymi nowościami w środku. Pierwsza warstwa to lepsze wyniki na pięciu z sześciu kluczowych benchmarków oraz wyraźny skok SWE-Bench Pro. Druga warstwa to Dynamic Workflows w Claude Code – setki równoległych subagentów dla zespołów na planach Enterprise, Team oraz Max. Trzecia warstwa to fast mode trzy razy tańszy plus effort control jako narzędzie do strojenia kosztu i jakości odpowiedzi. Tego samego dnia padły także liczby biznesowe: 65 miliardów dolarów świeżego kapitału przy wycenie 965 miliardów oraz zapowiedź Mythosa w najbliższych tygodniach. Dla użytkowników to dzień, w którym warto zaktualizować skróty w Claude Code. Następnie warto sprawdzić, jak zachowuje się effort control na typowym zadaniu. Dopiero potem warto zdecydować, czy nowy szybki tryb zmienia coś w rachunku za API.

Newsletter · DevstockAcademy & Kodożercy

Bądź na bieżąco ze światem IT, AI i automatyzacji

Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.


Udostępnij na:
Mateusz Wojdalski

Specjalista SEO i content marketingu w Devstock. Zajmuję się strategią treści, automatyzacją procesów marketingowych i wdrożeniami AI w codziennej pracy. Badam nowe narzędzia, adaptuję je do realnych zadań i piszę o tym, co faktycznie działa.

Rejestratory IP - jak dobrać liczbę kanałów, pojemność dysku i przepustowość do swojego monitoringu?
Banner reklamowy Frontend Master 2026

Najnowsze wpisy

Thumb
Claude Opus 4.8 – co przynosi nowy
29 maj, 2026
Thumb
Rejestratory IP – jak dobrać liczbę kanałów,
28 maj, 2026
Thumb
Lokalne LLM na starych V100: używany sprzęt
27 maj, 2026
Thumb
Bonsai Image 4B: generator obrazów AI mieści
27 maj, 2026
Thumb
TV Republika pokazała mapę Polski z innej rzeczywistości
27 maj, 2026

Kategorie

  • Aktualności i Wydarzenia (47)
  • Bezpieczeństwo i Jakość (49)
  • Branża IT i Nowe Technologie (92)
  • Design i User Experience (4)
  • Narzędzia i Automatyzacja (110)
  • Programowanie i Technologie Webowe (80)
  • Rozwój kariery i Edukacja (33)

Tagi

5G AI Architektura Cyberbezpieczeństwo Feedback Frontend Git IoT JavaScript Motywacja Nauka efektywna Optymalizacja i wydajność Programowanie React.JS Rozwój osobisty WebDevelopment
Logo FitBody Center Warszawa

Odkryj zabiegi Endermologii LPG Infinity w FitBody Center Warszawa

Maszyna zabiegowa - endermologia lpg infinity
banner-reklamowy-frontend-master
Group-5638-1

Devstock – Akademia programowania z gwarancją pracy

🏠 ul. Bronowska 5a,
03-995 Warszawa
📞 +48 517 313 589
✉️ contact@devstockacademy.pl

Linki

  • Poznaj firmę Devstock
  • Wejdź do społeczności Devstock
  • Polityka prywatności
  • Regulamin

FitBody Center

Strona

  • Strona główna
  • Kontakt

Newsletter

Bądź na bieżąco, otrzymuj darmową wiedzę i poznaj nas lepiej!


Icon-facebook Icon-linkedin2 Icon-instagram Icon-youtube Tiktok
Copyright 2026 Devstock. Wszelkie prawa zastrzeżone
Devstock AcademyDevstock Academy
Sign inSign up

Sign in

Don’t have an account? Sign up
Lost your password?

Sign up

Already have an account? Sign in