Dokładnie dwa miesiące po premierze Opus 4.6, Anthropic wydał kolejną iterację swojego flagowego modelu. Claude Opus 4.7 pojawił się 16 kwietnia 2026 roku w Anthropic API, Claude Pro/Max/Team/Enterprise, GitHub Copilot, Amazon Bedrock, Google Vertex AI i Microsoft Foundry. Model ma ten sam cennik co poprzednik (5 dolarów za milion tokenów wejściowych, 25 za wyjściowe), ale pod maską zmieniło się sporo. Krótko: lepsze kodowanie agentowe, nowy poziom wysiłku xhigh, ostrzejsze widzenie obrazów i zdolność modelu do samodzielnego weryfikowania własnych wyników. Co to znaczy w praktyce?
Co właściwie zmienia Claude Opus 4.7?
Claude Opus 4.7 to hybrydowy model rozumujący z oknem kontekstu 1 miliona tokenów, który Anthropic pozycjonuje jako następcę Opus 4.6 w codziennej pracy programistów i zespołów budujących agenty AI. Kluczowe zmiany dotyczą trzech obszarów: jakości kodu w zadaniach agentowych, obsługi obrazów oraz kontroli nad trybem rozumowania.
Pierwsza zmiana: model lepiej radzi sobie z długimi, wieloetapowymi zadaniami z narzędziami. Box w swojej ewaluacji odnotował 56% redukcję wywołań modelu i 50% redukcję wywołań narzędzi przy odpowiedziach o 24% szybszych niż w Opus 4.6. To jak z kurierem, który zamiast dziesięciu kursów do tego samego klienta przywozi paczkę w dwóch.
Druga zmiana to widzenie. Opus 4.7 przetwarza obrazy w rozdzielczości do 2576 pikseli na dłuższym boku, czyli ponad trzy razy więcej niż wcześniejsze modele Claude. Dzięki temu model znacznie lepiej czyta diagramy techniczne, schematy architektury i struktury chemiczne.
Trzecia zmiana: samoweryfikacja. Model potrafi sam wymyślić sposób weryfikacji własnych wyników, zanim zwróci odpowiedź. Zespół Anthropic twierdzi, że to jeden z głównych powodów, dla których 4.7 częściej niż 4.6 kończy zadania bez ręcznej korekty programisty.
Benchmarki Claude Opus 4.7 vs Opus 4.6 – co mówią liczby?
Anthropic pokazał konkretne dane porównujące nowy model z Opus 4.6 na zadaniach programistycznych, agentowych i wizualnych. Skupmy się na tych, które faktycznie przekładają się na codzienną pracę.
| Benchmark | Opus 4.6 | Opus 4.7 | Zmiana |
|---|---|---|---|
| CursorBench (kodowanie w edytorze) | 58% | 70% | +12 pkt proc. |
| Wewnętrzny benchmark 93-zadaniowy | brak bazy | brak bazy | +13% |
| SWE-Bench (real production tasks) | 1x | 3x | trzykrotnie więcej rozwiązanych |
| OfficeQA Pro (rozumienie dokumentów) | brak bazy | brak bazy | -21% błędów |
| Visual-acuity (precyzja widzenia) | 54,5% | 98,5% | +44 pkt proc. |
| Złożone workflow agentowe | brak bazy | brak bazy | +14%, 1/3 błędów narzędzi |
Najbardziej uderza wynik visual-acuity – różnica między 54,5% a 98,5% to nie jest drobna poprawka, tylko jakościowa zmiana w tym, jak model widzi interfejsy i diagramy. Dla zespołów budujących agenty, które klikają w aplikacje desktopowe lub analizują screenshoty, to bezpośrednio przekłada się na liczbę “ślepych” kliknięć i złych interpretacji.
Drugi ważny wynik to trzykrotny wzrost skuteczności na SWE-Bench przy produkcyjnych zadaniach. Anthropic nie ukrywa, że to benchmark wewnętrzny, więc trzeba go traktować ostrożnie, ale trend się zgadza z doświadczeniem wczesnych testerów z GitHub Copilot i Cursor.
Opus 4.7 radzi sobie z najtrudniejszą pracą programistyczną – taką, która wcześniej wymagała bliskiego nadzoru człowieka.
Jeśli zastanawiasz się, skąd bierze się ten skok po słabszym odbiorze Opus 4.6, warto wrócić do naszej analizy degradacji Opus 4.6. Część zmian w 4.7 to odpowiedź na krytykę.
Nowy poziom xhigh – co daje programiście?
Opus 4.7 wprowadza dodatkowy poziom wysiłku rozumowania między high a max, nazwany xhigh (“extra high”). To drobiazg w API, ale w praktyce daje finezyjną kontrolę nad kompromisem między głębokością analizy a czasem odpowiedzi.
Dotąd programista miał trzy opcje: niski wysiłek (szybko, powierzchownie), wysoki (wolniej, głębiej) lub max (bardzo wolno, bardzo głęboko, często niepotrzebnie). xhigh to rozwiązanie dla zadań, które są zbyt trudne dla high, ale nie wymagają pełnego max. Przykład z życia? Refaktoring 500 linii kodu w nieznanej bazie – max skończy to w pół godziny, xhigh w dziesięć minut z porównywalną jakością.
Anthropic zapowiada, że nowy poziom będzie szczególnie przydatny w zadaniach agentowych, gdzie latencja kumuluje się na dziesiątkach kroków. Każda sekunda oszczędzona na pojedynczym wywołaniu urasta do minut w całym workflow.
Przy okazji trzeba uważać na tokenizer. Anthropic zaktualizował sposób liczenia tokenów wejściowych, przez co tokenizacja tego samego prompta może dać 1,0 do 1,35 razy więcej tokenów niż w Opus 4.6. Do tego wyższe poziomy wysiłku generują dłuższe bloki rozumowania. Jeśli migrujesz długie prompty z 4.6 – policz koszty ponownie zanim uruchomisz batch na dziesiątkach tysięcy zapytań.


Dlaczego Anthropic nie wydaje Claude Mythos?
Przy okazji premiery Opus 4.7 Anthropic przyznał otwarcie coś, co wcześniej tylko dał do zrozumienia: ich wewnętrzny, silniejszy model o nazwie Mythos nadal nie trafia do użytkowników końcowych. Opus 4.7 pozostaje pod Mythos na wewnętrznych benchmarkach, ale to właśnie 4.7 dostał zieloną kartę na rynek.
Powód? Ryzyko nadużycia w obszarze cyberbezpieczeństwa. Anthropic tłumaczy, że Mythos w testach potrafił rozwiązywać zadania, które mogłyby pomóc w przygotowaniu ataków na krytyczne systemy. Opus 4.7 został wydany z zabezpieczeniami, które automatycznie wykrywają i blokują zapytania wskazujące na zakazane lub wysokie ryzyko cybernetyczne. Dlatego na rynku jest 4.7, a nie silniejszy brat.
Podobną logikę widać w świeżej funkcji, nad którą pracuje Anthropic – weryfikacji tożsamości person korzystających z Claude. To element tej samej strategii: zamiast wydać najmocniejszy model wszystkim, Anthropic próbuje rozpoznać kto i po co go używa, zanim odpowie.
To rozszerza kontekst przecieku danych, który ujawnił istnienie Mythos w marcu 2026. Wtedy Anthropic potwierdził istnienie modelu, ale nic nie mówił o dacie wydania. Teraz wiemy dlaczego – dopóki safety team nie zamknie zabezpieczeń, Mythos zostaje zamknięty.
Co to oznacza w praktyce? Firmy, które liczyły na “jeszcze silniejszy Claude” w ciągu kilku tygodni, mogą odłożyć te plany. Dwumiesięczny cykl wydawniczy Anthropic sugeruje, że następna iteracja pojawi się dopiero w czerwcu.
Pierwsza Misja AI · Kodożercy
Ogarnij podstawy AI
Pierwsza Misja AI to przystępny kurs Kodożerców – 8 krótkich lekcji z fabułą i interaktywnymi zadaniami. Dla każdego, kto chce zrozumieć jak działa AI. Ocena 4.94/5, dostęp bezterminowy.
Sprawdź kurs →

Gdzie korzystać z Opus 4.7 i ile to kosztuje?
Claude Opus 4.7 dostępny jest od premiery w Anthropic API pod identyfikatorem claude-opus-4-7. Znajdziesz go we wszystkich planach Claude (Pro, Max, Team, Enterprise) oraz u trzech dostawców chmury: Amazon Bedrock, Google Vertex AI i Microsoft Foundry. Cennik pozostał bez zmian w porównaniu z Opus 4.6.
- Cena standardowa: 5 dolarów za milion tokenów wejściowych, 25 dolarów za milion wyjściowych
- Prompt caching: do 90% oszczędności przy powtarzalnych kontekstach
- Batch processing: 50% rabatu dla zadań bez wymagania czasu rzeczywistego
- US-only inference: 1,1x standardowej ceny (dla firm wymagających przetwarzania wyłącznie w USA)
Dla programistów korzystających z GitHub Copilot model jest dostępny w planach Pro+, Business i Enterprise przez VS Code, Visual Studio, GitHub CLI, JetBrains, Xcode i Eclipse. Do 30 kwietnia GitHub obowiązuje promocja 7,5x premium request multiplier, co daje realnie znacznie niższy koszt za zapytanie. Administratorzy Copilot Business i Enterprise muszą jednak ręcznie włączyć dostęp do 4.7 w panelu ustawień.
Jeśli korzystasz z Claude Managed Agents, domyślny model dla nowych agentów zostanie podmieniony na 4.7 automatycznie. Istniejące agenty zostają na 4.6, dopóki ręcznie nie przełączysz ich w konfiguracji.
Dla zespołów wdrażających Claude w chmurze z wymaganiami compliance osobną lekturą jest analiza Opus 4.7 na Google Vertex AI. Tam rozkładamy enterprise angle – regiony, SLA, audyty, koszty per projekt.
Przy okazji: w Devstock wdrażamy AI i automatyzacje w firmach – agenty, workflow, migracje modeli. Masz z tym jakiś problem? Porozmawiajmy.
FAQ – Najczęstsze pytania o Claude Opus 4.7
Czy Claude Opus 4.7 zastępuje Opus 4.6?
Tak, 4.7 jest nowym domyślnym modelem Opus we wszystkich produktach Anthropic. Model 4.6 pozostaje dostępny w API pod starym identyfikatorem, więc istniejące integracje dalej działają bez zmian. Dla nowych projektów Anthropic rekomenduje od razu 4.7.
Czy Opus 4.7 działa w Claude Code?
Tak, Claude Code wspiera nowy model od dnia premiery. Warto jednak pamiętać o zmianie w tokenizatorze – ten sam prompt może zużywać do 35% więcej tokenów wejściowych niż w 4.6, co w dłuższej pracy wpływa na koszty.
Czy warto czekać na Claude Mythos?
Anthropic nie podał publicznej daty wydania Mythos i wyraźnie sygnalizuje, że blokują go kwestie bezpieczeństwa. Dwumiesięczny cykl wydawniczy modeli Opus sugeruje, że kolejna iteracja pojawi się w czerwcu 2026, ale niekoniecznie będzie to Mythos. W krótkim terminie Opus 4.7 jest najsilniejszym dostępnym modelem Anthropic.
Czy Opus 4.7 jest lepszy od GPT-5 i Gemini 3?
Wewnętrzne benchmarki Anthropic pokazują przewagę w zadaniach agentowych (coding, computer use). Porównania niezależne będą się pojawiać przez najbliższe tygodnie, więc warto poczekać z ostatecznymi wnioskami. W typowych zadaniach programistycznych 4.7 i konkurenci grają dziś w tej samej lidze, a wybór zależy głównie od ekosystemu (API, IDE, cennik, dostawca chmury). Jeśli zastanawiasz się która subskrypcja ma dla Ciebie sens, zajrzyj do naszego porównania ChatGPT Plus vs Claude Pro – tam rozbieramy limity, modele i realne koszty per plan.
Podsumowanie
Claude Opus 4.7 to sensowny krok naprzód względem 4.6, choć nie rewolucja. Dostajesz lepsze kodowanie agentowe, wyraźnie lepsze widzenie obrazów (98,5% vs 54,5% w visual-acuity) i nowy poziom wysiłku xhigh, który wypełnia lukę między high a max. Samoweryfikacja wyników zmniejsza liczbę sytuacji, w których model “halucynuje” edycje kodu, co było głośnym problemem 4.6.
Co zyskał programista? Mniej zbędnych wywołań narzędzi, krótsze i trafniejsze sesje, realny rabat 7,5x w GitHub Copilot do końca kwietnia. Co stracił? Trochę więcej tokenów wejściowych przez nowy tokenizer i świadomość, że gdzieś za ścianą u Anthropic stoi silniejszy Mythos, którego nie dostanie. Jeśli budujesz agenty produkcyjne – migruj teraz. Jeśli masz stabilny workflow na 4.6 – poczekaj na niezależne benchmarki, sprawdź koszty tokenów na swoim obciążeniu, potem decyduj.
Newsletter · DevstockAcademy & Kodożercy
Bądź na bieżąco ze światem IT, AI i automatyzacji
Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.



