Agent AI, który po skończonej sesji robi przegląd własnej pracy, wyciąga wnioski i wraca do nowego zadania mądrzejszy. Taki opis dotąd brzmiał jak slajd z konferencji pełen obietnic. Natomiast 6 maja 2026 Anthropic ogłosił, że właśnie ten mechanizm wchodzi w Claude Managed Agents jako podgląd badawczy. Razem z trzema kolejnymi funkcjami w publicznej becie: outcomes, multiagent orchestration oraz webhooks. Co więcej, każda z nich rozwiązuje konkretny ból znany każdemu, kto kiedykolwiek wsadził agenta AI do produkcyjnego workflow. Pokazujemy, czym dokładnie są te cztery funkcje, jak konkretne firmy (Harvey, Netflix, Spiral, Wisedocs) używają ich już w praktyce oraz co to znaczy dla osób budujących agenty w n8n.
Dreaming – agent uczy się ze swoich poprzednich sesji
Najciekawsza z czterech nowości to dreaming, czyli funkcja, która między sesjami agenta wyodrębnia wzorce z pamięci i kuruje wspomnienia. Innymi słowy: po skończonym zadaniu Claude robi własny “przegląd dnia”. Identyfikuje powtarzające się błędy, zauważa preferencje zespołu, dopisuje wnioski do swojej długoterminowej pamięci. Następnym razem, kiedy podchodzi do podobnego zadania, korzysta już z tej wiedzy, zamiast zaczynać od zera. Anthropic uruchomił dreaming jako research preview, dostępny po zaproszeniu (request access).
Pomysł jest prosty: zamiast trenować nowy model, pozwól istniejącemu modelowi przetwarzać własne wspomnienia jak człowiek przerabiający dzień podczas snu. Stąd nazwa.
W teście wewnętrznym kancelaria prawna Harvey pokazała, że dreaming zwiększył liczbę ukończonych zadań agenta około 6 razy. To bardzo konkretna liczba dla branży, w której agent codziennie obsługuje setki spraw kontraktowych i due diligence. Mianowicie różnica między 100 a 600 zadaniami dziennie. Co więcej, dreaming nie tylko zapamiętuje fakty z wcześniejszych sesji. On przetwarza je w bardziej użyteczną formę. Dzięki temu agent uczy się nie z surowego logu, tylko z destylacji własnego doświadczenia.
W praktyce dla Twojego workflow w n8n oznacza to jedno. Jeśli korzystasz z Claude Managed Agents do powtarzalnych zadań (analiza maili, klasyfikacja zgłoszeń, generowanie raportów), agent z czasem powinien zauważać wzorce specyficzne dla Twojej firmy. Ponieważ jednak dreaming jest jeszcze w research preview, dziś działa głównie u wybranych partnerów takich jak Harvey. Natomiast w ciągu kolejnych miesięcy funkcja powinna trafić do szerszej grupy użytkowników.
Outcomes – agent sprawdza, czy faktycznie skończył zadanie
Druga funkcja, outcomes, weszła już w public beta i dotyczy najbardziej zniechęcającego problemu agentów AI: kiedy uznać, że zadanie jest skończone. Wcześniej agent po prostu kończył pracę, kiedy uznał, że “raczej już zrobione”. Z kolei outcomes wprowadza rubrykę sukcesu, czyli zestaw kryteriów, które agent musi spełnić, żeby zadanie zostało uznane za ukończone. Osobny ewaluator (też model AI) sprawdza wynik i decyduje, czy agent ma kontynuować, czy może odpiąć się od zadania.
W testach wewnętrznych Anthropic pokazał konkretne liczby. W zadaniach generowania dokumentów Microsoft Word skuteczność wzrosła o 8,4 punktu procentowego. Z kolei dla prezentacji PowerPoint o 10,1 punktu procentowego. Może wydaje się, że to nie są spektakularne liczby, ale dla zadań produkcyjnych to różnica między “raczej działa” a “możemy to dać klientowi”. Co więcej, outcomes pozwala definiować rubrykę sukcesu w naturalnym języku, więc nie trzeba pisać kodu walidacyjnego.
Outcomes działa jak druga para oczu. Pierwszy agent generuje rozwiązanie, drugi sprawdza, czy spełnia kryteria. Trzeci może wracać do roboty z feedbackiem.
Dla osoby budującej w n8n to może ograniczyć liczbę własnych node’ów walidacyjnych po wywołaniach Claude’a. Mianowicie wbudowany ewaluator zajmuje się sprawdzaniem, czy odpowiedź faktycznie pasuje do tego, czego oczekiwałeś. W krytycznych workflow nadal jednak warto mieć niezależne reguły walidacji i logowanie. Outcomes to dobra pierwsza linia obrony, ale nie powinno być jedyną. Jeśli budujesz agenty AI w produkcji według zasad 12-factor agents, outcomes wpisuje się dokładnie w regułę jawnych kryteriów sukcesu.
Multiagent orchestration – lider deleguje, specjaliści pracują równolegle
Trzecia funkcja, multiagent orchestration, też weszła w public beta. Mechanizm jest prosty w opisie, ale produktowo to przełom. Agent lider deleguje podzadania specjalistycznym agentom. Pracują równolegle. Każdy ma własny model (Sonnet, Opus, Haiku) oraz własne narzędzia. Co więcej, wszyscy współdzielą jeden system plików, więc lider widzi, co specjaliści wytworzyli. Pełen ślad każdej sesji wieloagentowej dostępny jest w Claude Console.
Konkretne przykłady, które Anthropic pokazał, to trzy różne wzorce użycia. Netflix używa orkiestracji wieloagentowej do analizy logów z setek równoległych buildów. Każdy specjalista bierze jeden build, lider agreguje wnioski. Z kolei Spiral by Every (narzędzie do pisania) używa Haiku jako lidera, który deleguje zadania subagentom na Opusie. Tańszy model dyryguje, droższy kopie głębiej tam, gdzie trzeba. Wisedocs natomiast robi weryfikację dokumentów w orkiestracji wieloagentowej. Czas przeglądu spadł u nich o 50%.
Z kolei dla deweloperów to model architektury, który zna każdy, kto pracował z Claude Code i jego skillami. Lider trzyma kontekst całego zadania, specjaliści wykonują skupione fragmenty, wszyscy mają dostęp do tego samego workspace’u. Natomiast różnica jest taka, że Anthropic teraz zarządza tym wszystkim po stronie chmury. Czyli nie musisz sam pisać orkiestratora, ustawiać kolejki zadań ani synchronizować systemu plików między procesami. To duży skok w dostępności dla zespołów, które wcześniej musiały budować taką architekturę od zera.
Kurs n8n 2.0 · Kodożercy
n8n + AI = automatyzacje, które naprawdę myślą
n8n pozwala podłączyć modele AI do swoich workflow – wysyłać dane do ChatGPT, analizować wyniki, reagować automatycznie. Kurs n8n 2.0 na Kodożercach pokaże Ci jak to połączyć.
Sprawdź jak to działa →

Webhooks – powiadomienia po zakończeniu pracy agenta
Czwarta funkcja, webhooks, też w public beta, jest najbardziej “infrastrukturalna” z tej czwórki. Pozwala zdefiniować adres, na który Claude Managed Agents wyśle powiadomienie po zakończeniu zadania. Innymi słowy: zamiast pollować API w pętli, czekając aż agent skończy, ustawiasz webhook i Claude sam Cię stuknie, kiedy wynik jest gotowy. To różnica jak między dzwonieniem co minutę “czy już skończyłeś?” a dostaniem SMS-a “skończyłem”.
Dla automatyzacji w n8n to oczywista wygoda. Mianowicie: workflow z node Webhook Trigger może czekać na powiadomienie z Claude Console i ruszyć dalej dopiero, kiedy zadanie jest gotowe. Bez tracenia czasu na polling, bez błędów timeout, bez kombinowania z cron. Dlatego webhook stał się dziś standardem komunikacji między długimi zadaniami a orkiestratorem. Ten ruch porządkuje rzecz, której każdy spodziewał się od dawna.
Powiązanie z poprzednim ogłoszeniem
Claude Managed Agents jako produkt zostało pierwszy raz ogłoszone 9 kwietnia 2026. Wtedy mowa była głównie o samej koncepcji: chmurowy hosting agentów AI, zarządzanie sesjami po stronie Anthropic, dostęp przez Claude Platform. Z kolei ogłoszenie z 6 maja to konkretne funkcje produktowe, które pokazują, w którą stronę produkt idzie. Mianowicie: nie tylko hosting, ale też samouczenie się, samoocena, praca zespołowa i integracja z workflow.
To pokazuje strategię Anthropic. Nie konkurują na warstwie modeli, gdzie OpenAI i Google ścigają się benchmark po benchmarku. Konkurują na warstwie produktu, czyli na tym, jak praktycznie używasz tego modelu w automatyzacji.
Co więcej, te cztery funkcje wpisują się w szerszy trend, który widzieliśmy w ostatnich miesiącach. Cursor 3 dostał równoległą orkiestrację agentów. OpenAI rozwija Codex w stronę agenta autonomicznego. Microsoft, Google i inne firmy idą w tę samą stronę. Anthropic z Claude Managed Agents próbuje wyjść z tej batalii nie najlepszym modelem, tylko najlepiej zarządzanym ekosystemem agentów. Czas pokaże, czy to wystarczy.
FAQ – najczęstsze pytania o nowe Claude Managed Agents
Czy dreaming jest dostępny dla wszystkich od dziś?
Nie. Dreaming jest na razie w research preview, dostępny tylko po zaproszeniu (request access). Anthropic pokazał wyniki testów wewnętrznych z wybranymi partnerami (m.in. Harvey). Z kolei outcomes, multiagent orchestration oraz webhooks weszły w public beta. Są dostępne dla deweloperów korzystających z Claude Platform i Managed Agents, zależnie od dostępu i konfiguracji konta.
Czy mogę używać Claude Managed Agents w n8n?
Tak. Claude Managed Agents wystawia API i webhooks. Dlatego każdy workflow w n8n może wywołać agenta przez zwykłe wywołanie sieciowe. Następnie nasłuchuje na zakończenie przez Webhook Trigger. Mianowicie nowość polega na tym, że dziś masz outcomes (wbudowaną walidację) oraz orkiestrację wieloagentową dostępne bez budowania własnego orkiestratora.
Czym to się różni od skillów Claude Code?
Claude Code i jego skille to narzędzie deweloperskie do pracy lokalnej z kodem. Z kolei Claude Managed Agents to chmurowa platforma do uruchamiania agentów AI w sposób trwały i skalowalny. Dlatego skille Claude Code działają na Twoim komputerze podczas Twojej sesji. Natomiast Claude Managed Agents mogą kontynuować pracę w chmurze Anthropic także wtedy, gdy zamkniesz przeglądarkę. Po zalogowaniu wracasz do Claude Console i widzisz wyniki.
Podsumowanie
Anthropic 6 maja 2026 ogłosił cztery nowe funkcje Claude Managed Agents. Dreaming (research preview) pozwala agentowi uczyć się między sesjami. Konkretnie u Harvey dało to około 6x więcej ukończonych zadań. Outcomes (public beta) wprowadza rubrykę sukcesu i ewaluator. W testach wewnętrznych poprawiło skuteczność o 8,4 punktu procentowego dla Worda i 10,1 dla PowerPointa. Multiagent orchestration (public beta) pozwala agentowi liderowi delegować zadania specjalistom pracującym równolegle. Z Netflix, Spiral i Wisedocs jako pierwszymi referencjami. Webhooks (public beta) to powiadomienia po zakończeniu zadania, czyli koniec pollingu. Te cztery funkcje pokazują strategię Anthropic: nie ścigać się benchmarkami, tylko budować praktyczną platformę agentów, którą da się włączyć do produkcyjnego workflow. Dla osób pracujących z n8n to konkretny zestaw nowych klocków, które warto sprawdzić w najbliższych tygodniach.
Newsletter · DevstockAcademy & Kodożercy
Bądź na bieżąco ze światem IT, AI i automatyzacji
Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.



