Claude Code rate limits: dlaczego agenty AI gubią quota w 19 min?

Subskrypcja Claude Max kosztuje więcej niż większość SaaS-ów w portfelu. W zamian obiecuje 5 godzin intensywnej pracy z agentem AI, który może analizować duże repozytoria, utrzymywać długi kontekst i wykonywać wielokrokowe zadania. Od marca 2026 r. coraz więcej użytkowników zgłasza, że ten dzienny limit znika w 19 minut, a agent zatrzymuje się w połowie zadania. Przyczyna to błąd cache invalidation, który Anthropic przyznał oficjalnie. Jeśli budujesz automatyzacje z Claude Code, ten artykuł dotyczy Cię bezpośrednio.

Co się dzieje z pamięcią podręczną i dlaczego agentowe workflowy na tym cierpią?

Claude Code przez lata używał mechanizmu prompt caching: historia rozmowy i kontekst projektu były przechowywane w pamięci podręcznej, a kolejne wywołania modelu mogły z niej korzystać bez ponownego naliczania tokenów. W praktyce oznaczało to, że agentowe zadanie, które trwa 50 kroków, nie płaciło za 200 000 tokenów kontekstu 50 razy, lecz tylko raz przy pierwszym załadowaniu.

Błąd, który Anthropic potwierdził pod koniec marca 2026 r., polega na tym, że zapis do cache następuje poprawnie, natomiast odczyt z cache zawodzi nieoczekiwanie w trakcie sesji. Model traci dostęp do zapisanego kontekstu, pełna historia jest pobierana ponownie i cała ta operacja jest naliczana jako nowe tokeny. Przy każdym kolejnym kroku agenta cykl się powtarza.

Efekt jest drastyczny: zamiast 5 godzin pracy, użytkownik Max dostaje 19 minut. Trzy do czterech kroków agenta i dzienny limit jest na zero.

To trafnie opisuje skalę problemu. Kontekst projektu o rozmiarze 200 000 tokenów, przeliczany 50 razy zamiast raz, to 10 milionów tokenów. Plan Max ich nie pokrywa.

Które scenariusze są najbardziej narażone?

Nie każdy użytkownik odczuje problem tak samo. Według raportów z Reddita i DevOps.com najbardziej narażone są konkretne przypadki użycia:

Duże repozytoria z długą historią kontekstu. Im więcej plików i kodu w projekcie, tym większy kontekst ładowany przy każdym kroku agenta. Projekt z 50 plikami boli znacznie bardziej niż projekt z 5 plikami.

Wielokrokowe zadania automatyzacyjne. Jeśli agent ma wykonać sekwencję: przeanalizuj kod, napisz testy, uruchom weryfikację, popraw błędy, zgłoś PR – każdy krok to nowe wywołanie z pełnym kontekstem. Przy błędzie cache każdy krok płaci pełną cenę.

Automatyzacje w pipeline. Jeśli używasz Claude Code w workflow n8n, automatycznym pipeline CI/CD lub innym systemie, który wywołuje agenta w pętli, błąd może dosłownie wyzerować dzienny limit w jednym uruchomieniu bez żadnej informacji zwrotnej, ponieważ rate-limit error wygląda jak generyczny błąd i jest cicho retryowany.

Jeśli chcesz zobaczyć jak budować agenty odporne na takie sytuacje, przeczytaj jak zarządzać limitami tokenów w Claude Code.

Kurs n8n 2.0 · Kodożercy

Ile godzin tygodniowo tracisz na powtarzalne zadania?

n8n pozwala zautomatyzować to co robisz ręcznie – przesyłanie danych, powiadomienia, raporty. Kurs n8n 2.0 na Kodożercach pokaże Ci jak, krok po kroku, bez pisania kodu.

Sprawdź kurs n8n 2.0 →

Jak działać do czasu poprawki? Praktyczne obejścia

Na dzień publikacji tego artykułu Anthropic nie podało oficjalnego terminu poprawki. Natomiast społeczność deweloperów wypracowała kilka praktycznych strategii, które ograniczają skalę problemu.

Dziel zadania na mniejsze sesje. Zamiast zlecać agentowi analizę całego projektu naraz, podziel pracę na etapy z wyraźnymi punktami zatrzymania. Agent z 5000 tokenów kontekstu jest znacznie bezpieczniejszy niż agent z 200 000 tokenów.

Wykrywaj błędy limitu zapytań jawnie. W automatyzacjach n8n i pipeline CI/CD dodaj jawną obsługę błędów HTTP 429 (rate limit). Bez tego mechanizm ponownych prób może zużyć resztę limitu w ciągu minut bez żadnego sygnału dla użytkownika.

Używaj krótszych system promptów. System prompt jest ładowany przy każdym kroku agenta. Skrócenie go z 2000 do 500 tokenów to 75% mniej obciążenia w każdym wywołaniu dotkniętym bugiem.

Monitoruj zużycie tokenów per krok. Claude Code w trybie verbose loguje zużycie tokenów. Jeśli jeden krok zużywa tyle co cały projekt, to sygnał, że odczyt z pamięci podręcznej zawodzi.

Na wypadek, gdyby Anthropic wydłużał czas naprawy, warto sprawdzić alternatywne plany. W artykule o architekturze agentów AI w produkcji z Claude Code opisujemy podejście do projektowania systemów odpornych na limity API.

FAQ – Najczęstsze pytania o rate limits Claude Code

Dlaczego Claude Code Max wyczerpuje limit w 19 minut?

Przyczyną jest błąd unieważnienia pamięci podręcznej potwierdzony przez Anthropic w marcu 2026 r. Zapis do cache działa poprawnie, ale odczyt zawodzi w trakcie sesji. W efekcie przy każdym kroku agenta cały kontekst jest rozliczany jako nowe tokeny, zamiast być pobierany z pamięci podręcznej. Przy dużym projekcie 200 000 tokenów może być naliczone 50 razy zamiast raz.

Czy problem dotyczy tylko planu Max?

Błąd dotyka przede wszystkim plan Max, ponieważ to właśnie ten plan jest przeznaczony do długich agentowych sesji z dużym kontekstem. Użytkownicy Pro też mogą odczuć problem, jednak ich niższy limit sprawia, że sesje kończą się szybciej z innych powodów.

Kiedy Anthropic naprawi bug cache invalidation?

Na dzień publikacji tego artykułu (kwiecień 2026) Anthropic potwierdził problem, jednak nie podał terminu poprawki. Warto śledzić oficjalny status na status.anthropic.com oraz wątek na Reddit r/ClaudeAI.

Jak zabezpieczyć automatyzacje w n8n przed tym błędem?

Dodaj jawne wykrywanie błędu HTTP 429 w węźle n8n, ogranicz długość kontekstu przekazywanego do agenta i podziel duże zadania na mniejsze etapy z punktami zatrzymania. Dzięki temu jedna sesja nie wyzeruje całego dziennego limitu.

Podsumowanie

Błąd cache invalidation w Claude Code sprawia, że agenty AI na planie Max mogą wyczerpać dzienny limit w kilkanaście minut zamiast pięciu godzin. Problem dotyka szczególnie automatyzacje z dużym kontekstem projektu i wielokrokowe pipeline. Anthropic potwierdził błąd, jednak termin poprawki nie jest znany. Do czasu naprawy kluczowe jest dzielenie zadań na mniejsze sesje, jawne wykrywanie błędów rate-limit w automatyzacjach i skracanie system promptów. Jeśli budujesz produkcyjne workflow z Claude Code, to dobry moment, żeby zaprojektować je odporne na limity API od samego początku.

Newsletter · DevstockAcademy & Kodożercy

Bądź na bieżąco ze światem AI i automatyzacji

Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.

Mateusz Wojdalski

Specjalista SEO i content marketingu w Devstock. Zajmuję się strategią treści, automatyzacją procesów marketingowych i wdrożeniami AI w codziennej pracy. Badam nowe narzędzia, adaptuję je do realnych zadań i piszę o tym, co faktycznie działa.

Claude Code rate limits a agenty AI: dlaczego quota znika w 19 minut?

Co się dzieje z pamięcią podręczną i dlaczego agentowe workflowy na tym cierpią?

Które scenariusze są najbardziej narażone?

Ile godzin tygodniowo tracisz na powtarzalne zadania?

Jak działać do czasu poprawki? Praktyczne obejścia

FAQ – Najczęstsze pytania o rate limits Claude Code

Dlaczego Claude Code Max wyczerpuje limit w 19 minut?

Czy problem dotyczy tylko planu Max?

Kiedy Anthropic naprawi bug cache invalidation?

Jak zabezpieczyć automatyzacje w n8n przed tym błędem?

Podsumowanie

Bądź na bieżąco ze światem AI i automatyzacji

Mateusz Wojdalski

Linki

Strona

Newsletter

Claude Code rate limits a agenty AI: dlaczego quota znika w 19 minut?

Co się dzieje z pamięcią podręczną i dlaczego agentowe workflowy na tym cierpią?

Które scenariusze są najbardziej narażone?

Ile godzin tygodniowo tracisz na powtarzalne zadania?

Jak działać do czasu poprawki? Praktyczne obejścia

FAQ – Najczęstsze pytania o rate limits Claude Code

Dlaczego Claude Code Max wyczerpuje limit w 19 minut?

Czy problem dotyczy tylko planu Max?

Kiedy Anthropic naprawi bug cache invalidation?

Jak zabezpieczyć automatyzacje w n8n przed tym błędem?

Podsumowanie

Bądź na bieżąco ze światem AI i automatyzacji

Mateusz Wojdalski

Linki

Strona

Newsletter

Sign in

Sign up