Poinformowano także o zupełnie nowym teście porównawczym Procyon AI Image Generation od UL Solutions, który pozwala zmierzyć realną wydajność sprzętu w generowaniu obrazów za pomocą sztucznej inteligencji. Wewnętrzne testy firmy NVIDIA wykazały wzrost wydajności wynoszący 50% na karcie graficznej GeForce RTX 4080 SUPER w porównaniu do najszybszych aplikacji nie wykorzystujących biblioteki TensorRT.
Zanim zagłębimy się w szczegóły, krótkie wprowadzenie:
ChatRTX korzysta z biblioteki TensorRT-LLM, co pozwoliło zoptymalizować wydajność na kartach graficznych RTX, dzięki czemu teraz każdy może eksperymentować z podstawowymi modelami NVIDIA AI optymalizowanymi przez TensorRT-LLM.
W przypadku LLM, TensorRT przyspiesza także niektóre z najpopularniejszych generatywnych modeli sztucznej inteligencji, w tym Stable Diffusion i SDXL. W tym tygodniu rozszerzono optymalizację TensorRT w popularnym interfejsie Stable Diffusion WebUI firmy Automatic 1111 również na zestaw modeli AI zwany ControlNet. Działa on jak specjalny asystent dający użytkownikom większą kontrolę nad generowanymi obrazami. Zapewnia to wzrost wydajności nawet o 40%. Rozszerzenie jest już dostępne do pobrania z serwisu GitHub.