FLUX.2 debiutuje na kartach GeForce RTX – fotorealizm w 4K dzięki optymalizacji FP8

Black Forest Labs, we współpracy z NVIDIA, wprowadziło na rynek FLUX.2 – nową rodzinę modeli AI generujących obrazy na podstawie tekstowych opisów, będących następcą popularnego FLUX.1. Dzięki wspólnej optymalizacji i kwantyzacji FP8, te potężne, 32-miliardowe modele – pierwotnie wymagające aż 90 GB VRAM – mogą teraz działać na konsumenckich kartach GeForce RTX, zużywając o 40% mniej pamięci przy zachowaniu pełnej jakości fotorealizmu.
Rodzina modeli FLUX.2 wnosi szereg przełomowych funkcji, które mają wyeliminować charakterystyczne problemy wcześniejszych generatorów obrazu. Nowe modele oferują natywną rozdzielczość do 4 megapikseli oraz zaawansowaną kontrolę nad fizyką i oświetleniem, co pozwala uniknąć tzw. “AI look” – sztucznego wyglądu, który często zdradza pochodzenie grafiki. Kluczową nowością jest funkcja “multi-reference”, umożliwiająca artystom wykorzystanie do sześciu obrazów referencyjnych. Pozwala to na generowanie dziesiątek wariacji z zachowaniem spójnego stylu lub postaci bez konieczności żmudnego “dotrenowywania” modelu (fine-tuning). Dodatkowo FLUX.2 wprowadza bezpośrednią kontrolę pozy (pose control) oraz znacznie lepsze renderowanie tekstu, co sprawia, że napisy na infografikach czy interfejsach są wreszcie czytelne i poprawne.

Oszałamiające, fotorealistyczne detale. Obraz wygenerowany przy użyciu FLUX.2, dzięki uprzejmości Black Forest Labs.
Uruchomienie tak potężnego modelu (32 miliardy parametrów) w warunkach domowych było dotychczas niemożliwe – w pełnej wersji wymaga on 90 GB pamięci VRAM, a nawet w trybie “lowVRAM” około 64 GB. Aby to zmienić, NVIDIA nawiązała ścisłą współpracę z Black Forest Labs oraz twórcami popularnego interfejsu ComfyUI. Efektem jest udostępnienie modeli w skwantyzowanej wersji FP8, która redukuje zapotrzebowanie na pamięć wideo o 40% bez widocznej utraty jakości, jednocześnie przyspieszając generowanie o kolejne 40% na kartach RTX. Dodatkowo, zaktualizowany ComfyUI otrzymał usprawnioną funkcję “weight streaming”, która inteligentnie przenosi część danych modelu do systemowej pamięci RAM, gdy brakuje VRAM-u na karcie graficznej. Choć rozwiązanie to jest nieco wolniejsze, sprawia, że modele klasy enterprise stają się dostępne dla posiadaczy mocniejszych komputerów PC, a nie tylko serwerowni.

Modele FLUX.2 są już dostępne do pobrania m.in. na platformie Hugging Face oraz bezpośrednio poprzez szablony w zaktualizowanym ComfyUI, nie wymagając instalacji dodatkowego, specjalistycznego oprogramowania. Dla użytkowników z mniejszą ilością pamięci VRAM (np. 24 GB w RTX 4090/5090) społeczność opracowuje już dodatkowe optymalizacje, takie jak wersje GGUF czy NF4, które pozwalają na jeszcze większą kompresję. Black Forest Labs zapowiedziało również warianty modelu o różnej specyfice, w tym wersję [Pro] dla zastosowań komercyjnych oraz [Dev] z otwartymi wagami dla badaczy i entuzjastów.

Wszechstronność generowania: FLUX.2 potrafi tworzyć niezwykle szczegółowe, fotorealistyczne obrazy oraz infografiki ze złożoną typografią – wszystko w rozdzielczości do 4 megapikseli.






















