W tym tygodniu w serii RTX AI Garage NVIDIA prezentuje efekt współpracy z Black Forest Labs – jednym z wiodących ośrodków badawczych w dziedzinie AI. Efektem tej współpracy jest model FLUX.1 Kontext [dev] – inteligentne narzędzie AI, które pozwala tworzyć i edytować obrazy za pomocą prostych poleceń tekstowych i zdjęć referencyjnych.
Szybko, intuicyjnie i bez potrzeby specjalistycznej wiedzy. Model został zoptymalizowany pod kątem błyskawicznego działania na kartach graficznych RTX dzięki zestawowi narzędzi programistycznych NVIDIA TensorRT. FLUX.1 Kontext [dev] umożliwia połączenie generowania i edycji obrazów w ramach jednego, intuicyjnego procesu pracy. W przeciwieństwie do tradycyjnych metod wymagających złożonych konfiguracji modeli i ControlNetów, FLUX.1 Kontext [dev] pozwala na przeprowadzanie edycji krok po kroku przy użyciu języka naturalnego i obrazów referencyjnych, bez konieczności strojenia lub skomplikowanej konfiguracji.
Dzięki optymalizacjom wprowadzonym przez Black Forest Labs i NVIDIA z wykorzystaniem TensorRT i zaawansowanej kwantyzacj, model FLUX.1 Kontext [dev] działa nawet dwukrotnie szybciej i zużywa znacznie mniej pamięci VRAM. To sprawia, że zaawansowane techniki generowania i edycji obrazów AI stają się dostępne w czasie rzeczywistym dla szerszego grona twórców i deweloperów pracujących na urządzeniach wyposażonych w karty graficzne GeForce RTX.
Korzyści modelu FLUX.1 Kontext [dev]:
Możliwości modelu FLUX.1 Kontext [dev] obejmują:
Model FLUX.1 Kontext [dev] został udostępniony na platformie Hugging Face w wersjach Torch i TensorRT. Użytkownicy mogą testować go za pośrednictwem ComfyUI. Dodatkowo Black Forest Labs udostępniło także interaktywne środowisko testowe online do sprawdzania możliwości modelu. W sierpniu planowane jest udostępnienie wersji mikroserwisu NVIDIA NIM – zestawu zoptymalizowanych modeli AI, które można łatwo integrować i uruchamiać lokalnie na urządzeniach z kartami graficznymi GeForce RTX. Dla zaawansowanych użytkowników i deweloperów przygotowywany jest przykładowy kod integracyjny procesu pracy z TensorRT. Repozytorium DemoDiffusion zostanie opublikowane jeszcze w tym miesiącu.
Dodatkowo, NVIDIA ogłosiła wsparcie dla multimodalnego modelu Google Gemma 3n na platformach z kartami graficznymi GeForce RTX i Jetson.
NVIDIA przypomina także o wydarzeniu Plug and Play: Project G-Assist Hackathon, które zorganizowane jest w formule online i potrwa do 16 lipca. Wydarzeniu będzie towarzyszyć webinarium How to Build a G-Assist Plug-In zaplanowane na 9 lipca między 19:00 a 20:00, podczas którego zaprezentowane zostaną możliwości Project G-Assist, podstawy tworzenia i wdrażania wtyczek oraz sesja pytań i odpowiedzi na żywo.