Anthropic zdecydował się na krok, który zaboli konkurencję bardziej niż same benchmarki. Claude Sonnet 5 startuje z niższą ceną wejściową niż jego poprzednik. Jednocześnie ma dogonić droższego Opusa 4.8 pod względem rozumowania, kodowania i pracy analitycznej. Przez pierwsze dwa miesiące milion tokenów wejściowych kosztuje dwa dolary, wyjściowych dziesięć. Dlatego jest to cena obniżona o jedną trzecią w stosunku do docelowego cennika. Tego samego dnia Anthropic zapowiedział też osobny produkt Claude Science, przygotowany dla laboratoriów genomiki i bioinformatyki. W rezultacie dwie zapowiedzi w jednym komunikacie mówią więcej o strategii firmy niż osobne informacje o wynikach na testach porównawczych.
Claude Sonnet 5 – co dokładnie zmienia się w codziennej pracy
Sonnet 5 zastąpił Sonneta 4.6 jako domyślny model dla planów Free i Pro. Jednocześnie stał się dostępny w Max, Team i Enterprise. Poza tym w API pojawia się pod identyfikatorem claude-sonnet-5. Sama zmiana wersji zwykle nie jest tematem do artykułu. Tutaj jednak wchodzi razem z deklaracją, że nowy Sonnet zbliża się do Opusa 4.8 na wielu typach zadań. Co więcej, Anthropic pisze o wyraźnym skoku w rozumowaniu, korzystaniu z narzędzi i analizie danych. Natomiast dochodzą do tego niższe wskaźniki halucynacji i pochlebstw wobec użytkownika.
Ciekawszy jest jednak sposób opisania różnicy w pracy agentycznej. Sonnet 5 ma dokańczać złożone zadania, przy których poprzedni model się zatrzymywał. Dlatego oznacza to w praktyce lepszą samokontrolę, gdy model prowadzi kilkuetapowy proces. Chodzi na przykład o przepisanie większego modułu kodu albo migrację schematu bazy. Testerzy raportują też lepsze debugowanie i zachowanie kontekstu w pomieszanych sytuacjach technicznych. W efekcie dla zespołu programistycznego przekłada się to na mniej prób i mniej ręcznego naprowadzania. Dochodzi do tego mniej porzuconych sesji, po których i tak trzeba dokończyć zadanie samemu.
Ile realnie kosztuje przejście na Sonnet 5
Wprowadzająca cena to dwa dolary za milion tokenów wejściowych i dziesięć dolarów za milion wyjściowych. Obowiązuje ona do końca sierpnia 2026 roku. Docelowo model ma kosztować trzy i piętnaście dolarów. Dlatego wciąż jest to mniej od Opusa 4.8, przy porównywalnej jakości. W praktyce zespoły utrzymujące swój produkt na starszym Sonnetcie mogą przełączyć się bez zmiany budżetu. Z kolei klienci Opusa dostają realną alternatywę tam, gdzie do tej pory nadgryzali marżę na kosztach modelu.
Claude Science – osobny produkt dla laboratoriów, nie tryb modelu
Claude Science to nie funkcja w głównym Claude, tylko osobna aplikacja desktop dla macOS i Linuksa. Na razie działa jednak w wersji beta. Adresatem są natomiast laboratoria z obszaru nauk przyrodniczych. Chodzi głównie o genomikę, single-cell RNA-seq, bioinformatykę strukturalną i cheminformatykę. W praktyce Anthropic obiecuje tam rzeczy, których użytkownik zwykłego czatu z modelem nie dostanie. Chodzi na przykład o pełną historię kodu i konwersacji przy każdym artefakcie oraz o natywne renderery struktur białek i ścieżek genomicznych. Poza tym dochodzi do tego automatyczna weryfikacja cytatów i zgodności danych z bazami źródłowymi.
Dochodzi do tego skalowanie obliczeń, od laptopa aż po klastry HPC. Dzięki temu ta sama sesja pracy może przenieść ciężką analizę z lokalnego sprzętu na zewnętrzne moce i dostarczyć finalny artefakt bez rozbijania procesu na osobne narzędzia. Do tego dochodzi ponad sześćdziesiąt integracji z bazami naukowymi, elektronicznymi notatnikami laboratoryjnymi i narzędziami modelowania białek. W efekcie Claude Science celuje w codzienny stos pracy naukowego zespołu, a nie w pojedynczą konsultację.
Dwie zapowiedzi w jeden dzień – co to mówi o strategii Anthropic
Zestawienie Sonneta 5 i Claude Science w jednym komunikacie nie jest przypadkowe. Anthropic celowo pokazuje dwie ścieżki wzrostu, które nie kolidują z głównym produktem. Z jednej strony obniża cenę wejścia do modelu dobrej klasy. Chodzi o to, żeby zatrzymać średnich klientów, którzy zaczęli patrzeć w stronę prywatnej bety Grok 4.5 albo w stronę chińskich modeli Sakana i 360. Z drugiej wchodzi tam, gdzie nie musi wygrywać ceną, tylko funkcjami, których żadna platforma czatu nie ma.
Ważne jest to, że docelowym klientem Claude Science są zespoły badawcze, nie pojedynczy użytkownik. Chodzi bowiem o budżet naukowo-technologiczny uniwersytetów, dużych szpitali i spółek biotech. Dostęp indywidualny w beta idzie przez plany Pro i Max, jednak pełne wdrożenie w laboratorium wymaga kontaktu z działem sprzedaży. Anthropic mierzy więc w pieniądze grantowe i budżety R&D. Z kolei to zupełnie inny rodzaj przychodu niż subskrypcja Pro albo API pay-per-token. Rok temu podobną ścieżkę zaczął OpenAI z wersjami dla nauki i finansów. Dziś natomiast Anthropic dorzuca własną, bardzo konkretną domenę.
Polski wątek nie jest tu tylko dekoracją. Nasze uczelnie i spółki biotech coraz częściej pracują na chmurze zamiast na własnym HPC. Dlatego produkt, który sam zarządza kosztami obliczeń i dokumentuje każdy krok, może być decyzją zakupową na poziomie prorektora do spraw nauki, a nie pojedynczego doktoranta. W efekcie Sonnet 5 zostaje jednak tam, gdzie był, w codziennej pracy zespołów produktowych, które od dawna używają Anthropic obok OpenAI.
Pierwsza Misja AI · Kodożercy
Używasz AI codziennie – ale czy robisz to dobrze?
Kurs Pierwsza Misja AI pokaże Ci techniki promptowania, które naprawdę działają. Praktyczne ćwiczenia z prawdziwym GPT-4, gamifikacja i certyfikat.
Sprawdź program kursu →

Podsumowanie
Sonnet 5 nie próbuje wygrać rankingu Chatbot Areny w ten weekend. Zamiast tego chce powoli zdusić droższą część własnej oferty i utrudnić klientom przejście do konkurencji. Z kolei Claude Science otwiera drzwi tam, gdzie wcześniej Anthropic nie próbował wchodzić. Chodzi o budżety laboratoriów genomiki, bioinformatyki i biotech. Pełną skuteczność tego układu poznamy dopiero, gdy zobaczymy pierwsze publikacje naukowe autoryzujące wyniki wygenerowane w Science. Do tego dojdzie porównanie rachunków klientów Enterprise za Sonneta 5 z dotychczasowymi rachunkami za Opus 4.8 i Mythos 5. Dopiero wtedy będzie widać, czy Anthropic obronił marżę, czy jednak podarował sobie kwartał niższego przychodu z flagowca. Więcej o samej architekturze modelu i jego zachowaniu w długich sesjach agentycznych opisuje dokumentacja Anthropic.
Newsletter · DevstockAcademy & Kodożercy
Bądź na bieżąco ze światem IT, AI i automatyzacji
Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.



