Tokeny zalewają budżety: Microsoft, Uber i GitHub mówią dość

13 miliardów dolarów zainwestowane w OpenAI, partnerstwo z Anthropic, Microsoft 365 Copilot rosnący o 123% rok do roku. A jednak 14 maja 2026 Microsoft anulował licencje Claude Code dla większości zespołu Experiences and Devices. Miesiąc wcześniej CTO Ubera przyznał, że budżet AI na rok rozszedł się w cztery miesiące. Równolegle GitHub Copilot przechodzi od 1 czerwca na rozliczenia tokenowe. Trzy doniesienia z ostatnich tygodni układają się w narrację: to nie krach AI, lecz wejście branży w fazę rentowności – czas mierzenia rzeczywistych kosztów inferencji. Dla polskich firm planujących drugą połowę 2026 ten sam rachunek przyjdzie z kilkumiesięcznym opóźnieniem.

Microsoft anuluje Claude Code – paradoks na własnym podwórku

Najmocniejsza część tej historii nie polega na samym anulowaniu, lecz na tym, kto je ogłosił. 14 maja 2026 list do tysięcy inżynierów wysłał Rajesh Jha, wiceprezes odpowiedzialny za zespół Experiences and Devices. Dotyczy to ludzi pracujących nad Windowsem, Microsoft 365, Teams, Outlookiem i Surface. Jednak ton komunikatu był neutralny. Firma natomiast ujednolica narzędzia wokół Copilot CLI, który może rozwijać bezpośrednio z GitHubem. Dodatkowo termin na przesiadkę wypada 30 czerwca 2026, czyli ostatni dzień roku obrotowego Microsoftu.

Popularniejsze niż własny Copilot CLI, ale po prostu drogie

Ten zbieg dat jednak nie jest przypadkowy. Microsoft otworzył dostęp do Claude Code w grudniu 2025 i narzędzie szybko zyskało większą popularność wśród inżynierów niż własny Copilot CLI. Co ciekawe, anulowanie przyszło nie dlatego, że Claude Code był słabszy. Wręcz przeciwnie – był po prostu drogi. Rozliczenia za tokeny Anthropic, w przeliczeniu na tysiące aktywnych inżynierów, generowały rachunek nie do domknięcia. Nawet dla firmy, której biznes AI rośnie o 123% rok do roku i ma 20 milionów płatnych miejsc Microsoft 365 Copilot. Co więcej, 64% firm z listy Fortune 500 ma już aktywne wdrożenia Copilot Microsoftu. Innymi słowy, Microsoft nie wycofuje się z AI. Wycofuje się ze zbyt drogiego, zewnętrznego interfejsu developerskiego.

Co zostaje z partnerstwa Microsoft-Anthropic

Mimo wszystko modele Claude (Opus 4.6 i 4.7) są nadal dostępne przez Microsoft Foundry oraz w wybranych zadaniach w M365 Copilot. Dodatkowo partnerstwo na warstwie modelu trwa, zniknął tylko ten konkretny interfejs developerski. To wygląda trochę tak, jak duża firma logistyczna, która zaczyna sama obsługiwać swoje przesyłki wewnętrzne. Jednocześnie tego samego partnera dalej oferuje klientom. Innymi słowy, współpraca biznesowa zostaje, jednak codzienna praca przechodzi pod własny dach. Tam da się ją lepiej kontrolować i rozliczać.

Dlaczego Microsoft wybrał własne narzędzie

Sens komunikatu Jha sprowadza się do dwóch rzeczy. Po pierwsze, sześć miesięcy pracy na Claude Code dało zespołowi GitHub czas, żeby dogonić ten interfejs. Po drugie, Microsoft chce mieć narzędzie, które kształtuje sam z GitHubem pod własne repozytoria, polityki bezpieczeństwa i procesy inżynierskie. W rzeczywistości to nie jest możliwe z produktem zewnętrznego dostawcy. Z kolei tę logikę zna każdy zespół, który próbował dopasować zewnętrzny SaaS do specyficznych wymagań korporacji. Im głębsza integracja, tym bardziej ciąży licencja kogoś innego.

Uber wyczerpał część R&D na AI w cztery miesiące

Drugi punkt układanki dostarczył Praveen Neppalli Naga, CTO Ubera. Tym razem komunikat wyszedł 15 kwietnia 2026 na branżowej konferencji i w wewnętrznym piśmie do zespołu. Przy tym liczby są konkretne. Roczny budżet R&D Ubera w 2026 wynosi 3,4 miliarda dolarów. To o 9% więcej rok do roku. W tej puli znajduje się część przeznaczona na narzędzia AI. Właśnie ona została wyczerpana po zaledwie czterech miesiącach. W efekcie CTO przyznał w parafrazie: wraca do tablicy, bo budżet rozszedł się znacznie szybciej, niż zakładał.

Jak Claude Code zjadł budżet w cztery miesiące

Jak doszło do tej eskalacji, łatwo opisać krok po kroku. Uber otworzył Claude Code dla całego zespołu inżynierskiego w grudniu 2025. W efekcie adopcja skoczyła z 32% do 84% w cztery miesiące. Mianowicie mówimy o pięciu tysiącach inżynierów. Miesięczny koszt API na jednego inżyniera wahał się od 500 do 2000 dolarów. Im więcej kontekstu, tym więcej tokenów i tym wyższy rachunek. Dziś 11% produkcyjnych zmian w backendzie pisze agent AI. Z kolei 70% commitów ma jego udział, a 95% inżynierów Ubera korzysta z narzędzi AI co miesiąc.

Polska skala: 100 inżynierów = 0,6-2,4 mln zł rocznie

W przeliczeniu na polską skalę liczba jest jeszcze bardziej namacalna. Wyobraź sobie software house ze 100 inżynierami pracującymi z Claude Code w trybie podobnym do Ubera. W rezultacie za same tokeny zapłaci od 600 tys. do 2,4 mln złotych rocznie. Dla firmy z przychodem 20-30 mln zł to nowa pozycja kosztowa porównywalna z pensją starszego inżyniera. Z tą różnicą, że pracownik kończy dzień o 17. Natomiast rachunek tokenowy rośnie 24 godziny na dobę, jeśli ktoś zostawi agenta w pętli.

Komunikat Amodei trafia w klienta zamiast w konkurencję

To dokładnie ten moment, w którym CEO Anthropic Dario Amodei ostrzegł niedawno o bankructwach SaaS-ów. Chodzi o firmy próbujące utrzymać marże w erze drogiej inferencji. Pisaliśmy o tym w tekście Dario Amodei o bankructwach SaaS i końcu fosy. Tyle że tym razem komunikat trafił bezpośrednio do dużego klienta korporacyjnego Anthropic, a nie do konkurencji.

GitHub Copilot przechodzi na tokeny – co to znaczy w praktyce

Trzeci punkt układanki to oficjalna decyzja GitHuba ogłoszona 27 kwietnia 2026. Od 1 czerwca 2026 plany miesięczne Copilot przechodzą na rozliczenia oparte o GitHub AI Credits. To jednostka przeliczeniowa, w której zużycie liczy się jako sumę tokenów (wejście, wyjście, cache). Jednak jest jeden wyjątek od reguły. Mianowicie roczne subskrypcje Pro i Pro+ wykupione wcześniej pozostają w starym modelu “premium request units”. Dopiero kolejna płatność wpadnie w nowe zasady.

Kontekst tej zmiany jest mocniejszy, niż się pozornie wydaje. W październiku 2023 Wall Street Journal podał, że Microsoft tracił ponad 20 dolarów na każdym użytkowniku Copilota miesięcznie, mimo iż produkt kosztował 10 dolarów. Dodatkowo niektórzy użytkownicy kosztowali firmę nawet 80 dolarów. W tym czasie GitHub Copilot miał kilkaset tysięcy subskrybentów. Dziś, po skoku do 4,7 miliona płatnych użytkowników na początek 2026 (wzrost o 75% rok do roku), ten sam model rozliczeń przy trybie agentowym oznacza po prostu ekonomiczną klęskę. Stąd presja, żeby wycenić produkt po faktycznych kosztach.

Cztery plany i jedna nowa jednostka kredytów

Bazowe ceny planów nie zmieniają się ani o grosz, zmienia się mechanika tego, co użytkownik dostaje:

Copilot Pro za 10 dolarów miesięcznie – 10 dolarów w kredytach AI, doładowanie poza limit dostępne
Copilot Pro+ za 39 dolarów miesięcznie – 39 dolarów w kredytach, doładowanie dostępne
Copilot Business za 19 dolarów na użytkownika miesięcznie – 19 dolarów w kredytach, plus promocyjne 30 dolarów w okresie czerwiec-sierpień 2026
Copilot Enterprise za 39 dolarów na użytkownika miesięcznie – 39 dolarów w kredytach, plus promocyjne 70 dolarów w tym samym okresie

Plan “ile zużyjesz, tyle zużyjesz” już się nie zwraca

GitHub oficjalnie tłumaczy zmianę zdaniem, które warto przeczytać dwa razy: “Copilot nie jest już tym samym produktem co rok temu”. Stary plan działał dopóty, dopóki Copilot głównie podpowiadał kolejne linie kodu w edytorze. Jednak po wejściu w tryb agentowy zmienia się wszystko. Wielokrokowe rozumowanie i wywołania narzędzi to zupełnie inna skala kosztów inferencji. W efekcie stała miesięczna kwota tego nie udźwignie. Ten sam mechanizm zadziałał zresztą wewnątrz Microsoftu. Z tą różnicą, że tam zamiast renegocjować plan, po prostu anulowano licencje.

Polski programista i drugi rachunek na koniec miesiąca

Co to znaczy dla polskiego developera korzystającego z Copilot Pro+ za 160 zł miesięcznie? Dopóki sesje są krótkie, a tryb agentowy uruchamia się rzadko, limit 39 dolarów w kredytach wystarcza. Natomiast aktywny programista pracujący codziennie z dużymi plikami przekroczy limit w dwa tygodnie. W efekcie dokupi nadwyżkę i dostanie drugi rachunek, którego dwa miesiące temu nie było. Pasuje tu prosta analogia z telefonii. Mianowicie dopóki używasz pakietu w ramach limitu, płacisz stałą kwotę. Natomiast po przekroczeniu transferu rachunek skacze proporcjonalnie do tego, ile zużywasz dalej.

Dlaczego akurat teraz – trzy czynniki schodzą się w 2026

Pytanie, które warto sobie zadać przed dalszą lekturą, brzmi tak. Co takiego dzieje się w 2026, że Microsoft, Uber i GitHub w ciągu czterech tygodni podjęli trzy podobne decyzje? Odpowiedź to splot trzech zjawisk, których do tej pory branża traktowała osobno.

Anthropic wychodzi na zysk operacyjny, a klient płaci za rentowność

Pierwszy czynnik to przesunięcie po stronie dostawcy. Mianowicie w maju 2026 Anthropic projektuje pierwszy w historii zysk operacyjny. Konkretnie 559 milionów dolarów w Q2 przy przychodach 10,9 miliarda (130% wzrost rok do roku). Co jeszcze ważniejsze, marża na inferencji wzrosła z 38% rok temu do 70% dziś. Dodatkowo wewnętrzne koszty inferencji spadły o 90% rok do roku. To dane przekazane inwestorom przed planowaną rundą i trzeba je czytać z ostrożnością. Jednak kierunek jest jasny. W efekcie Anthropic przestaje subsydiować klientów i zaczyna domagać się od nich cen, które dają firmę zdolną do IPO. W tej sytuacji Microsoft odpada z równania, kiedy widzi własny rachunek.

Compute drożeje szybciej, niż optymizacje go obniżają

Drugi czynnik to ekonomia GPU. W teorii nowy Nvidia B200 daje siedmiokrotną redukcję kosztu inferencji wobec H100 (około 0,02 dolara na milion tokenów wobec 0,14). W praktyce branża dopiero przesiada się na Blackwell, a ceny pamięci HBM3E rosną o 20% w 2026. Co więcej, globalny popyt na GPU przewyższa podaż 1,4-1,6 razy i ten stan utrzyma się przez kolejne 18-24 miesiące. Dodatkowo wynajem H100 w chmurze przebił 2 dolary za godzinę i wzrasta o 15-20% miesięcznie. Mimo iż jednostkowy koszt inferencji modeli spada, faktyczne rachunki klientów rosną szybciej. W istocie adopcja agentowa zjada każdą oszczędność technologiczną.

Branża wchodzi w fazę dyscypliny przed IPO

Trzeci czynnik to presja inwestorska. Anthropic szykuje się do rundy przy wycenie liczonej w setkach miliardów dolarów. Z kolei OpenAI prawdopodobnie wejdzie na giełdę w 2027 lub 2028. W rezultacie wycena obu firm zakłada, że klienci enterprise będą płacić rosnące rachunki kwartał po kwartale. Dlatego laboratoria nie mogą sobie pozwolić na zatrzymanie zwrotu z jednostkowej transakcji, nawet kosztem niezadowolenia największych klientów. Microsoft to widzi i przelicza, gdzie warto trzymać licencję, a gdzie nie. Uber natomiast widzi to samo. GitHub z kolei działa od strony dostawcy i dopasowuje swoją politykę cenową, żeby nie tracić 20 dolarów na każdym płatniku.

Trzeba jednak pamiętać o drugiej stronie obrazu. Microsoft dalej inwestuje w Anthropic na poziomie modeli, hostuje Claude w ekosystemie Foundry i sprzedaje go w swoich produktach end-userowych. Mimo to cięcie konkretnej licencji nie oznacza rozejścia się dwóch firm. Oznacza natomiast, że dla największych klientów Anthropic pierwszy raz zaczyna obowiązywać racjonalna kalkulacja zwrotu z narzędzia. Z kolei średnia firma enterprise dostanie nadal dobre warunki, tylko z widoczną tabelką zużycia i wskaźnikami efektywności na koniec kwartału.

Kurs n8n 2.0 · Kodożercy

Ile godzin tygodniowo tracisz na powtarzalne zadania?

n8n pozwala zautomatyzować to co robisz ręcznie – przesyłanie danych, powiadomienia, raporty. Kurs n8n 2.0 na Kodożercach pokaże Ci jak, krok po kroku, bez pisania kodu.

Sprawdź kurs n8n 2.0 →

Co to znaczy dla polskich firm i developerów

Trzy wnioski dla każdego, kto planuje budżet AI

Te trzy doniesienia układają się w jedną wiadomość dla każdego, kto planuje stos AI na drugą połowę 2026. Era subsydiowanych planów Pro dla developerów nie wraca. Ona właśnie się skończyła. Poza tym w modelu tokenowym nie ma “niewidzialnego” zużycia. Każdy prompt z dużym kontekstem zostawia wpis na rachunku. Tak samo każda iteracja agenta i każde “spróbuj jeszcze raz”. W efekcie firmy bez mechanizmu mierzenia tokenów dostaną miesięczne faktury, których nie zrozumieją.

Polski software house z 50 inżynierami – dwa warianty rachunku

Jak to mogłoby wyglądać w polskim software housie zatrudniającym 50 inżynierów? Zakres jest dziś szeroki. Polska adopcja agentowego Claude Code dopiero rozkręca się, a większość zespołów nie pcha tak jak Uber. W wariancie ostrożnym (20% zespołu pracuje agentowo, reszta lekko) rachunek tokenowy zmieści się w 200-400 tys. złotych rocznie. Natomiast w wariancie zbliżonym do Ubera (60% agentowo, 40% lekko) ten sam zespół wyda 800 tys. – 1,7 mln złotych rocznie. To tylko za same tokeny, bez pensji, sprzętu i reszty stosu. Dla firmy z przychodem 20-30 mln zł rocznie ta druga wartość odpowiada w przybliżeniu kosztowi 2-3 pensji seniorskich brutto. Z drugiej strony pracownik kończy dzień o 17. Natomiast rachunek tokenowy rośnie 24 godziny na dobę, jeśli ktoś zostawi agenta w pętli.

Dwie ścieżki wyjścia: dyscyplina pomiarowa i lokalne modele

Dziś najwyraźniej widać dwie ścieżki wyjścia. Pierwsza to dyscyplina pomiarowa: firmowy dashboard zużycia tokenów na użytkownika, twarde limity miesięczne i polityka “agent zostaje wyłączony przed weekendem”. Druga to częściowe lokalne LLM-y do zadań, które nie potrzebują chmury. Pisaliśmy o tym kierunku w tekście Local-first AI – manifest przeciwko chmurowemu nawykowi. W efekcie większość firm pójdzie obiema na raz. Chmurowy stos dla najtrudniejszych zadań, lokalne modele dla rutynowych, a na koniec twarde limity dla wszystkich.

Cztery kroki dla polskiego software house na czerwiec i lipiec

W polskim software house konkretne kroki wyglądają prosto. Zacznij od audytu obecnych subskrypcji Copilot Pro/Pro+. Aktywnych użytkowników agentowych warto przesunąć na roczne plany przed 1 czerwca, dopóki stary model jeszcze obowiązuje. Dalej włącz dashboard zużycia tokenów na poziomie zespołu albo projektu (Anthropic Console, AWS Cost Explorer dla Bedrock, GitHub Billing dla Copilot). Następnie skategoryzuj zadania developerskie na trzy typy: agentowe wieloplikowe (chmura), pojedyncze refaktoryzacje (chmura lub lokalne 30B+), generyczne podpowiadanie kodu (lokalne 7-14B). Na koniec rozpocznij negocjacje z dostawcami AI. Duzi klienci enterprise dostają dziś elastyczność cenową, której nie było pół roku temu.

Praktyczna obserwacja z rozmów z polskimi zespołami inżynierskimi: większość zarządów do tej pory nie wiedziała, ile miesięcznie kosztuje stos AI w ich firmie. Po 1 czerwca przestanie to być abstrakcja.

Co dalej – dwa scenariusze najbliższych miesięcy

Pierwszy scenariusz mówi, że firmy zaczną tnąć użycie, żeby zmieścić się w budżetach. Jeśli to przeważy, najwięksi dostawcy AI (Anthropic, OpenAI, Google) zobaczą wolniejszą rampę przychodów. Stanie się to przy tym dokładnie wtedy, gdy ich wyceny przed IPO zależą od projekcji wzrostu. Z kolei drugi scenariusz mówi, że laboratoria obniżają ceny i wchłaniają stratę. Pogarszają tym swoją ekonomię jednostkową na czas, którego jeszcze potrzebują. Tyle, żeby model Opus 5 albo GPT-6 zaczął się zwracać. Najbardziej prawdopodobne jest jedno i drugie naraz. Mianowicie wielkie korporacje (Microsoft) optymalizują przez ucinanie zewnętrznych narzędzi. Indywidualni programiści z kolei szukają tańszych alternatyw: Cursor, Zed z OpenRouterem, Cline z lokalnym LLM-em. Ten trend opisaliśmy w tekście Claude Code za drogi? Dev przeszedł na Zed i OpenRouter.

W tle gra jeszcze jedna stawka. Rynkowe spekulacje mówią, że Anthropic szykuje się do kolejnej rundy finansowania przy podniesionej wycenie. Projekcja opiera się na rosnących rachunkach klientów korporacyjnych. Jeśli więc duży klient pokroju Microsoftu mówi “nie”, to sygnał dla każdego dyrektora finansowego. Dotyczy to wszystkich polskich i europejskich firm planujących AI. Negocjacyjna pozycja klienta właśnie wzrosła. Rozliczenia za tokeny nie znikną. Ceny za token i limity będą jednak zmieniać się szybciej, niż dotychczas zakładano.

Podsumowanie

Microsoft, Uber i GitHub w ciągu czterech tygodni podjęli te same kosztowe decyzje. Branża AI przechodzi z fazy “rozdajemy kredyty, żeby zdobyć rynek” do fazy “płaćmy rachunek, który odzwierciedla rzeczywisty koszt inferencji”. To nie alarm o krachu, lecz sygnał dojrzewania modelu biznesowego – Microsoft 365 Copilot rośnie 123% rok do roku, Anthropic projektuje pierwszy zysk operacyjny. Dla polskich firm prośba jest jedna: zacznij mierzyć tokeny na zespół już dziś, zanim dostawca zrobi to za ciebie. Pierwszy miesiąc, w którym faktura tokenowa zaskoczy zarząd skalą, przyjdzie szybciej, niż się wydaje. Ten, kto wcześniej zrozumiał ekonomię swojego stosu, dostanie bonus w postaci spokojnego budżetu i przestrzeni negocjacyjnej. Reszta dostanie naukę przez doświadczenie, w tym samym formacie, w którym Uber właśnie skończył ją odbierać.

Newsletter · DevstockAcademy & Kodożercy

Bądź na bieżąco ze światem IT, AI i automatyzacji

Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.

Mateusz Wojdalski

Specjalista SEO i content marketingu w Devstock. Zajmuję się strategią treści, automatyzacją procesów marketingowych i wdrożeniami AI w codziennej pracy. Badam nowe narzędzia, adaptuję je do realnych zadań i piszę o tym, co faktycznie działa.

Microsoft anulował Claude Code, Uber wyczerpał budżet AI w 4 miesiące. Koniec ery stałych cen

Microsoft anuluje Claude Code – paradoks na własnym podwórku

Popularniejsze niż własny Copilot CLI, ale po prostu drogie

Co zostaje z partnerstwa Microsoft-Anthropic

Dlaczego Microsoft wybrał własne narzędzie

Uber wyczerpał część R&D na AI w cztery miesiące

Jak Claude Code zjadł budżet w cztery miesiące

Polska skala: 100 inżynierów = 0,6-2,4 mln zł rocznie

Komunikat Amodei trafia w klienta zamiast w konkurencję

GitHub Copilot przechodzi na tokeny – co to znaczy w praktyce

Cztery plany i jedna nowa jednostka kredytów

Plan “ile zużyjesz, tyle zużyjesz” już się nie zwraca

Polski programista i drugi rachunek na koniec miesiąca

Dlaczego akurat teraz – trzy czynniki schodzą się w 2026

Anthropic wychodzi na zysk operacyjny, a klient płaci za rentowność

Compute drożeje szybciej, niż optymizacje go obniżają

Branża wchodzi w fazę dyscypliny przed IPO

Ile godzin tygodniowo tracisz na powtarzalne zadania?

Co to znaczy dla polskich firm i developerów

Trzy wnioski dla każdego, kto planuje budżet AI

Polski software house z 50 inżynierami – dwa warianty rachunku

Dwie ścieżki wyjścia: dyscyplina pomiarowa i lokalne modele

Cztery kroki dla polskiego software house na czerwiec i lipiec

Co dalej – dwa scenariusze najbliższych miesięcy

Podsumowanie

Bądź na bieżąco ze światem IT, AI i automatyzacji

Mateusz Wojdalski

Linki

Strona

Newsletter

Microsoft anulował Claude Code, Uber wyczerpał budżet AI w 4 miesiące. Koniec ery stałych cen

Microsoft anuluje Claude Code – paradoks na własnym podwórku

Popularniejsze niż własny Copilot CLI, ale po prostu drogie

Co zostaje z partnerstwa Microsoft-Anthropic

Dlaczego Microsoft wybrał własne narzędzie

Uber wyczerpał część R&D na AI w cztery miesiące

Jak Claude Code zjadł budżet w cztery miesiące

Polska skala: 100 inżynierów = 0,6-2,4 mln zł rocznie

Komunikat Amodei trafia w klienta zamiast w konkurencję

GitHub Copilot przechodzi na tokeny – co to znaczy w praktyce

Cztery plany i jedna nowa jednostka kredytów

Plan “ile zużyjesz, tyle zużyjesz” już się nie zwraca

Polski programista i drugi rachunek na koniec miesiąca

Dlaczego akurat teraz – trzy czynniki schodzą się w 2026

Anthropic wychodzi na zysk operacyjny, a klient płaci za rentowność

Compute drożeje szybciej, niż optymizacje go obniżają

Branża wchodzi w fazę dyscypliny przed IPO

Ile godzin tygodniowo tracisz na powtarzalne zadania?

Co to znaczy dla polskich firm i developerów

Trzy wnioski dla każdego, kto planuje budżet AI

Polski software house z 50 inżynierami – dwa warianty rachunku

Dwie ścieżki wyjścia: dyscyplina pomiarowa i lokalne modele

Cztery kroki dla polskiego software house na czerwiec i lipiec

Co dalej – dwa scenariusze najbliższych miesięcy

Podsumowanie

Bądź na bieżąco ze światem IT, AI i automatyzacji

Mateusz Wojdalski

Linki

Strona

Newsletter

Sign in

Sign up