Generator obrazów AI z porządnej półki właśnie zmieścił się w paczce mniejszej niż jeden odcinek serialu w 4K. PrismML opublikował 26 maja 2026 rodzinę modeli Bonsai Image 4B. Cały transformer dyfuzyjny zajmuje 930 megabajtów w wariancie 1-bitowym lub 1,21 gigabajta w wariancie ternary. Dla porównania FLUX.2 Klein 4B, na którym Bonsai jest oparty, waży 7,75 GB. Redukcja sięga ośmiokrotnej, a wariant ternary zachowuje 95 procent jakości oryginału w benchmarkach producenta. W rezultacie cięcie rozmiaru otwiera drogę, której do tej pory nie było. Pierwszy raz model generujący obrazy w klasie czterech miliardów parametrów odpalisz w zwykłej karcie przeglądarki na WebGPU. Co więcej, działa również natywnie na iPhonie. To rynkowy średniak, a nie laboratoryjna miniatura. Pełne wagi i kod producent udostępnił na licencji Apache 2.0, dlatego dopuszcza także zastosowania komercyjne.
Co dokładnie wypuścił PrismML
Bonsai Image 4B wystartował w dwóch wariantach. Wersja 1-bit trzyma każdą wagę modelu w jednej z dwóch wartości – minus jeden albo plus jeden. Wersja ternary dokłada zero, czyli stan, w którym waga jest po prostu wygaszona. Dodatkowy stan kosztuje trochę miejsca (transformer rośnie z 0,93 do 1,21 GB), jednak w zamian model lepiej trafia w intencję prompta.
Liczby wyglądają wręcz nierealnie, dlatego warto je rozłożyć na konkrety. Pełny pakiet na Apple Silicon dla Bonsai 1-bit zajmuje 3,42 GB, a dla wariantu ternary 3,88 GB. Natomiast FLUX.2 Klein 4B w pełnej precyzji potrzebuje 15,97 GB. Pamięć operacyjna w trakcie generowania obrazu 512×512 schodzi do 1,5 GB w wariancie 1-bit. Dla ternary jest to 1,96 GB, natomiast FLUX potrzebuje 11,74 GB. W efekcie mamy różnicę między modelem, który zmieści się obok przeglądarki na zwykłym laptopie, a modelem, który blokuje pół pamięci roboczej.
Czas generowania PrismML podaje wprost: obraz 512×512 powstaje w 9,4 sekundy na iPhonie 17 Pro Max i w około sześciu sekundach na Macu M4 Pro. Producent zaznacza, że na Macu to w najlepszym razie 5,6 raza szybciej niż pełna precyzja FLUX. W zestawieniu z komercyjnymi generatorami subskrypcyjnymi te liczby nie powalają, jednak chodzi tu o coś innego niż czysty wynik. Pierwszy raz model tej klasy w ogóle działa na telefonie i w zakładce zwykłej przeglądarki, a nie tylko na serwerze za zaporą OpenAI.
Bonsai mieści się w paczce mniejszej niż jeden odcinek serialu w rozdzielczości 4K, a robi to, co jeszcze rok temu wymagało wynajęcia czterech kart graficznych w chmurze.
Jakość PrismML mierzy trzema benchmarkami: GenEval (czy model poprawnie składa obiekty na obrazie), HPSv3 (preferencje ludzkich oceniających) oraz DPG-Bench (wierność wobec prompta). Wariant 1-bit dochodzi do 88 procent wyniku oryginalnego FLUX.2 Klein 4B, wariant ternary do 95 procent. Pięć procent różnicy w jakości w zamian za sześciokrotnie mniejszy model wygląda na transakcję, na którą zgodziłby się każdy CFO.
Dlaczego jeden bit na wagę w ogóle działa
Klasyczny model AI trzyma każdą wagę w 16 bitach precyzji zmiennoprzecinkowej. To dokładnie tyle, ile potrzeba, żeby zapisać liczbę w rozsądnym przybliżeniu – z dziesiętnymi po przecinku, znakiem, zakresem rzędu wielkości. Kwantyzacja do jednego bitu wyrzuca to wszystko poza znakiem. Każda waga przechowuje już tylko informację “ciągnie w tę stronę” albo “ciągnie w drugą”. W wariancie ternary dochodzi opcja “nie ciągnie wcale”.
Wygląda to jak strzelba w miejscu pistoletu precyzyjnego, i przez długi czas właśnie tak działało. Pierwsze 1-bitowe modele traciły większość zdolności językowych, a w przypadku obrazów wpadały w wizualną papkę. Działa tu jednak ta sama logika, co w telewizji cyfrowej. Sygnał analogowy potrzebował całego pasma częstotliwości, żeby zachować szczegół. Sygnał cyfrowy z zero-jedynkową strukturą daje obraz lepszy niż dawne analogowe nadawanie, jeśli tylko sposób kodowania jest odpowiednio sprytny. Bonsai dokłada do skrajnej kwantyzacji grupowy współczynnik skalujący w normalnej precyzji FP16. To uratowanie większości jakości.
To również drugi etap dłuższej historii. PrismML jest tą samą firmą, która jesienią 2025 pokazała 1-bitowe modele językowe Bonsai w serii nazwanej później “14x mniejsze bez strat jakości”. Wtedy chodziło o LLM-y, teraz o dyfuzję. To istotne, ponieważ generatory obrazów uchodziły za dużo trudniejsze do kwantyzacji – jedna źle wycelowana waga w modelu dyfuzyjnym potrafi zmienić twarz na grafice w bezkształtną plamę.
Co to zmienia dla pracy z wrażliwymi danymi
Architekt rysujący makiety budynku dla kontrowersyjnej inwestycji, dziennikarz przygotowujący ilustracje do śledztwa, agencja reklamowa pracująca nad nowym brandingiem klienta – każdy z nich do tej pory miał ten sam dylemat. Wgranie prompta do generatora w chmurze oznacza, że firma trzecia widzi pomysł, nazwę projektu, czasem konkretne nazwiska. Część firm zakazywała używania ChatGPT i Midjourney właśnie z tego powodu. Lokalne generowanie obrazów wymagało jednak własnej karty graficznej z dużą pamięcią i cierpliwości do instalacji.
W tej rozmowie Bonsai zmienia jeden konkretny parametr: minimalny próg wejścia. Przeglądarka i trzy gigabajty pobranego modelu wystarczą, żeby zacząć. Polski kontekst tego problemu opisaliśmy szerzej w tekście o prawniku, który zbudował własny klaster AI z 12 kart V100 – tam stawką były akta procesowe, a wydatek szedł w dziesiątki tysięcy złotych. Bonsai nie zastąpi takiego setupu w zadaniach językowych, jednak dla wizualnych pomysłów zdejmuje z biurka problem “wyślij prompt do chmury i módl się”.
Po raz pierwszy generator obrazów z tej półki nie wymaga konta, połączenia i zaufania do dostawcy. Wystarczy adres w przeglądarce.
Jest też druga strona medalu, której PrismML nie reklamuje. Modele otwarte na licencji Apache 2.0, działające bez moderacji w przeglądarce, znaczą również brak filtrów, które OpenAI i Stability AI nakładają na swoje API. Pierwsza fala zastosowań Bonsai prawdopodobnie pojawi się w projektach, w których właśnie te filtry były problemem – od pełnoprawnej kreacji artystycznej po szare strefy generowanych zdjęć produktowych. Discover będzie miał o czym pisać w kolejnych tygodniach.
Co rynek zrobi z tym kosztem NVIDII
Historia 1-bitowych modeli nie była dotąd dobrą wiadomością dla producenta najdroższych kart graficznych. Każda kolejna kompresja modelu oznacza prostą rzecz. Zamiast karty H100 za kilkadziesiąt tysięcy dolarów wystarczy konsumenckie GPU za kilka tysięcy. W przypadku Bonsai granica spada jeszcze niżej. Dla wariantu 1-bit nie potrzeba żadnej karty NVIDII, ponieważ wystarczy układ neuronowy w telefonie albo zintegrowany akcelerator w Macu M4.
Dla branży to sygnał kontynuujący trend, który ciągnie się od pojawienia się DeepSeek V4 i Qwen3.6. Pisaliśmy o tym w analizie pojedynku NVIDIA, Apple i AMD na rynku lokalnych modeli. Wcześniej kompresja dotyczyła generowania tekstu. Teraz dotarła do generowania obrazów, czyli najbardziej kapitałochłonnego zastosowania AI w chmurze. Jeśli ta sama kompresja zadziała w przyszłym roku na modele wideo, układ sił na rynku narzędzi kreatywnych zmieni się poważniej niż przy debiucie DALL-E.
Kurs n8n 2.0 · Kodożercy
n8n + AI = automatyzacje, które naprawdę myślą
n8n pozwala podłączyć modele AI do swoich workflow – również lokalne generatory obrazów takie jak Bonsai, jeśli prompt nie może trafić do cudzej chmury. Kurs n8n 2.0 na Kodożercach pokaże Ci, jak skleić to z resztą firmowego procesu.
Sprawdź jak to działa →

Podsumowanie
Bonsai Image 4B nie jest najsilniejszym generatorem obrazów na rynku. Od FLUX.2 Klein 4B dzieli go 5-12 punktów procentowych jakości w benchmarkach, a od komercyjnej czołówki znacznie więcej. PrismML rozegrał tę różnicę inaczej, ponieważ zamienił najwyższą jakość na dostępność. Nie trzeba karty graficznej, konta, połączenia z chmurą ani subskrypcji. Wystarczą trzy gigabajty pobrane raz i dowolna przeglądarka z WebGPU. Dla pracy z wrażliwymi danymi to skok porównywalny z momentem, gdy LLM-y zeszły z serwerów badawczych do laptopów. Pod każdą taką premierą wraca jedno pytanie. Kogo bardziej zaboli możliwość odpalenia tego samego lokalnie – twórców modeli zamkniętych, czy producenta kart graficznych, które do tego nie są potrzebne?
Newsletter · DevstockAcademy & Kodożercy
Bądź na bieżąco ze światem IT, AI i automatyzacji
Co wtorek: newsy z branży, praktyczne tipy i narzędzia które warto znać. Zero spamu.



