Claude Code limity tokenów: uciekająca quota i jak to naprawić

Płacisz $200 miesięcznie za Claude Max 20x żeby nie martwić się limitami. Siadasz do pracy o ósmej rano i o 8:19 dostajesz komunikat “Rate limit reached.” Cały dzienny budżet tokenów spalony w jednej sesji. To nie jest scenariusz z Twittera, to doświadczenie setek użytkowników od końca marca 2026 roku. Okazało się, że za kryzysem stoją trzy niezależne przyczyny naraz.

Co się stało? Trzy problemy w jednym tygodniu

Od 23 marca 2026 r. na GitHubie, Reddicie i X zaczęły masowo pojawiać się raporty o nienormalnie szybkim znikaniu limitu Claude Code. Issue #38335 w repozytorium Anthropic zebrało 275+ komentarzy i 225+ upvote’ów. Zbiegły się trzy niezależne zdarzenia:

Po pierwsze, Anthropic cicho zmieniło throttling w godzinach szczytu. 26 marca pracownik Anthropic Thariq Shihipar ogłosił oficjalnie to co działo się od trzech dni: w dni robocze między 5:00 a 11:00 PT (13:00–19:00 czasu polskiego) limity 5-godzinnych sesji spalają się szybciej. Tygodniowy limit pozostaje taki sam, ale jego dystrybucja w ciągu dnia jest inna. Według Anthropic dotyczy to około 7% użytkowników.

Po drugie, 28 marca skończyła się tymczasowa promocja 2x off-peak, której wielu użytkowników nie zauważyło ani nie zapamiętało.

Po trzecie, w wersjach Claude Code między v2.1.69 a v2.1.76 weszły dwa bugi psujące cache promptów, które mogą zwiększyć zużycie tokenów 10-20x bez żadnego ostrzeżenia.

Bug #1: –resume niszczy cache przy każdym zapytaniu

Flaga --resume służy do wznawiania poprzednich sesji. Brzmi jak dobry pomysł na oszczędzanie tokenów, bo nie trzeba budować kontekstu od nowa. W praktyce, od wersji v2.1.69, działa dokładnie odwrotnie.

Regression polega na tym, że messages[0] ma fundamentalnie inną zawartość w świeżej sesji (około 13,4 KB) i w sesji wznowionej (około 352 B). Ta różnica sprawia, że cache prefix nie pasuje i cały kontekst konwersacji musi być przebudowany od zera przy każdym zapytaniu. Zamiast cache_read (tanie, 0,1x ceny bazowej) dostajesz cache_write przy każdej wiadomości.

Zmierzone dane z bugged sesji:

cache_read: zablokowane na ~14 500 tokenach (tylko system prompt)
cache_write: rośnie z każdym turnem: 54 437 → 55 084 → 55 512 → 55 733
Koszt wiadomości: ~$0,35-0,40 zamiast ~$0,02

To 1310 cache rewrites na 1 token wejściowy w jednym z dokumentowanych przypadków.

Workaround: Nie używaj --resume. Zamiast tego użyj /clear żeby zacząć świeżą sesję, a /rename na początku do nadania sesji nazwy którą łatwo potem odnajdziesz.

Bug #2: sentinel string niszczy cache prefix

Drugi bug jest subtelniejszy. Ktoś spędził kilka dni reverse-engineerując standalone binary Claude Code przy pomocy Ghidry i MITM proxy i znalazł funkcję w warstwie natywnej customowego forku Bun, który Anthropic używa w standalone binary.

Na każde zapytanie do /v1/messages kod wyszukuje w treści zapytania string cch=00000 (wewnętrzny sentinel do atrybucji billingowej) i podmienia go na 5-znakowy hex. Problem: podmiana działa na pierwszym wystąpieniu w całym JSON body. Ponieważ messages[] pojawia się przed system[] w JSON, jeśli historia rozmowy zawiera ten string (np. czytałeś kod źródłowy Claude Code, rozmawiałeś o nagłówkach HTTP lub masz go w CLAUDE.md), sentinel zostaje podmieniony w historii zamiast w system promptcie. Zmieniona treść historii niszczy cache prefix i wywołuje pełny rebuild kontekstu.

Kiedy cache jest zepsuty, każde zapytanie jest traktowane jakby była to twoja pierwsza wiadomość. Cały kontekst jest naliczany od nowa przy każdym turnie.

Workaround: Zamiast standalone binary (claude) używaj npx @anthropic-ai/claude-code. Komenda npx pobiera paczkę z npm i uruchamia ją przez Node.js, omijając customowy fork Bun z bugiem.

Ile tokenów naprawdę zużywa Claude Code?

Bez bugów, typowe zużycie według analizy Faros AI:

Średni koszt w trybie API: około $6 dziennie na dewelopera
1. percentyl: poniżej $12 dziennie
Duży plik CLAUDE.md (2800 linii): ~2100 tokenów startu sesji. Skrócenie do 200 linii oszczędza 62% na start

Szacunkowe limity tokenów per plan (Anthropic nie publikuje oficjalnych liczb):

Plan	Cena	Tokeny per okno 5h	Wiadomości Opus (est.)
Pro	$20/mies.	~44 000	~45
Max 5x	$100/mies.	~88 000	~225
Max 20x	$200/mies.	~220 000	~900

Ważne: Claude.ai, Claude Code i Claude Desktop dzielą ten sam limit. Jeśli rano korzystałeś z Claude.ai do pisania maili, quotę Claude Code masz już nadgryźioną.

Jak monitorować zużycie w czasie rzeczywistym?

Dwa narzędzia open-source do śledzenia burn rate:

ccusage to CLI do szybkiego podglądu. Odczytuje lokalne pliki JSONL z historią sesji:

npx ccusage

Claude-Code-Usage-Monitor to dashboard w terminalu z live podglądem cache hit ratio, zużycia per sesja i przewidywanym czasem do wyczerpania limitu. Oba narzędzia działają lokalnie i nie wysyłają danych na zewnątrz.

Workaroundy które działają

Jeśli trafiasz na limity szybciej niż powinieneś, sprawdź w tej kolejności:

1. Zaktualizuj Claude Code do v2.1.89 lub nowszego. Anthropic wypuścił 1 kwietnia 2026 aktualizację która naprawia cache misses w długich sesjach, wielokrotne wstrzykiwanie plików CLAUDE.md i bugi –resume.

2. Jeśli nie możesz zaktualizować, wróć do v2.1.68:

npm install -g @anthropic-ai/claude-code@2.1.68

To wersja sprzed regressji –resume. Kilkadziesiąt osób na GitHubie potwierdziło wyraźną poprawę.

3. Zamiast standalone binary używaj npx:

npx @anthropic-ai/claude-code

4. Pracuj poza godzinami szczytu. Weekendy i godziny nocne (przed 13:00 lub po 19:00 czasu polskiego w dni robocze) nie podlegają throttlingowi.

5. Skróć CLAUDE.md. Każda sesja wczytuje plik od nowa. 2800 linii to 2100 tokenów przy każdym starcie.

6. Sprawdź jedno zapytanie. Jeśli pierwsze zapytanie zjadło 3-5% sesji, cache jest już zepsuty w tej sesji. Zrestartuj Claude Code przed kontynuowaniem.

Kurs n8n 2.0 · Kodożercy

Ile godzin tygodniowo tracisz na powtarzalne zadania?

n8n pozwala zautomatyzować to co robisz ręcznie: przesyłanie danych, powiadomienia, raporty. Kurs n8n 2.0 na Kodożercach pokaże Ci jak, krok po kroku, bez pisania kodu.

Sprawdź kurs n8n 2.0 →

FAQ: Claude Code limity tokenów

Dlaczego Claude Max 20x wyczerpuje się szybciej niż Pro?

Jeśli Twój Max 20x wyczerpuje się szybciej niż stary plan Pro, prawie na pewno masz zepsuty cache. Przy normalnym działaniu Max 20x daje 20x więcej tokenów niż Pro. Przy bugach cache’u wszystkie plany zachowują się jakby limit był 10-20x mniejszy, niezależnie od subskrypcji.

Czy przełączenie z Opus na Sonnet pomoże?

Tak, znacząco. Opus ma tighter tygodniowe limity i jest droższy w przeliczeniu na token. Sonnet 4.6 przy tych samych zadaniach zużywa wyraźnie mniej z tygodniowej puli. Claude Code domyślnie wybiera model, ale możesz go wymusić flagą --model.

Czy limity Claude.ai i Claude Code są wspólne?

Tak. Wszystkie interfejsy (claude.ai, Claude Code, Claude Desktop) korzystają z tego samego limitu przypisanego do konta. Poranna sesja na claude.ai zmniejsza quotę dostępną w Claude Code.

Co się stanie po osiągnięciu limitu?

Claude Code pokazuje komunikat “Rate limit reached” i przestaje odpowiadać do końca okna 5-godzinnego. Limit resetuje się automatycznie, nie musisz nic robić.

Podsumowanie

Kryzys limitów Claude Code z marca 2026 to zbieg trzech niezależnych czynników: celowego throttlingu w godzinach szczytu, końca tymczasowej promocji i dwóch regresji w cache’owaniu promptów. Aktualizacja do v2.1.89 naprawia oba bugi cache’u. Jeśli czekasz z aktualizacją, wróć do v2.1.68 i zastąp standalone binary komendą npx. Monitoruj zużycie przez ccusage i sprawdzaj pierwsze zapytanie każdej sesji jako sygnał czy cache działa poprawnie.

Mateusz Wojdalski

Specjalista SEO i content marketingu w Devstock. Zajmuję się strategią treści, automatyzacją procesów marketingowych i wdrożeniami AI w codziennej pracy. Badam nowe narzędzia, adaptuję je do realnych zadań i piszę o tym, co faktycznie działa.

Claude Code limity tokenów: dlaczego quota znika w 19 minut i co z tym zrobić

Co się stało? Trzy problemy w jednym tygodniu

Bug #1: –resume niszczy cache przy każdym zapytaniu

Bug #2: sentinel string niszczy cache prefix

Ile tokenów naprawdę zużywa Claude Code?

Jak monitorować zużycie w czasie rzeczywistym?

Workaroundy które działają

Ile godzin tygodniowo tracisz na powtarzalne zadania?

FAQ: Claude Code limity tokenów

Dlaczego Claude Max 20x wyczerpuje się szybciej niż Pro?

Czy przełączenie z Opus na Sonnet pomoże?

Czy limity Claude.ai i Claude Code są wspólne?

Co się stanie po osiągnięciu limitu?

Podsumowanie

Mateusz Wojdalski

Linki

Strona

Newsletter

Claude Code limity tokenów: dlaczego quota znika w 19 minut i co z tym zrobić

Co się stało? Trzy problemy w jednym tygodniu

Bug #1: –resume niszczy cache przy każdym zapytaniu

Bug #2: sentinel string niszczy cache prefix

Ile tokenów naprawdę zużywa Claude Code?

Jak monitorować zużycie w czasie rzeczywistym?

Workaroundy które działają

Ile godzin tygodniowo tracisz na powtarzalne zadania?

FAQ: Claude Code limity tokenów

Dlaczego Claude Max 20x wyczerpuje się szybciej niż Pro?

Czy przełączenie z Opus na Sonnet pomoże?

Czy limity Claude.ai i Claude Code są wspólne?

Co się stanie po osiągnięciu limitu?

Podsumowanie

Mateusz Wojdalski

Linki

Strona

Newsletter

Sign in

Sign up