OpenAI, lider w dziedzinie sztucznej inteligencji, właśnie ogłosił wprowadzenie GPT-4o mini – najbardziej ekonomicznego małego modelu w swojej ofercie. To przełomowe rozwiązanie ma na celu znaczne rozszerzenie zakresu zastosowań AI poprzez uczynienie inteligencji znacznie bardziej przystępnej cenowo.
GPT-4o mini to model, który łączy w sobie wysoką wydajność z niskimi kosztami. Oto jego najważniejsze cechy:
Wydajność: Model osiąga wynik 82% w teście MMLU (Massive Multitask Language Understanding) i obecnie przewyższa GPT-4 w preferencjach czatu na tablicy liderów LMSYS.
Cena: Koszt użytkowania to zaledwie 15 centów za milion tokenów wejściowych i 60 centów za milion tokenów wyjściowych. To o rząd wielkości taniej niż poprzednie modele graniczne i ponad 60% taniej niż GPT-3.5 Turbo.
Wszechstronność: GPT-4o mini obsługuje tekst i obrazy w API, z planowanym wsparciem dla wejść i wyjść tekstowych, obrazowych, wideo i audio w przyszłości.
Kontekst: Model ma okno kontekstowe 128K tokenów i obsługuje do 16K tokenów wyjściowych na żądanie.
Aktualna wiedza: Baza wiedzy modelu jest aktualna do października 2023 roku.
Wielojęzyczność: Dzięki ulepszonemu tokenizerowi, obsługa tekstów nieanglojęzycznych jest teraz jeszcze bardziej efektywna kosztowo.
GPT-4o mini wyróżnia się na tle konkurencji w wielu kluczowych obszarach:
Zadania rozumowania: W teście MMLU GPT-4o mini osiągnął wynik 82,0%, w porównaniu do 77,9% dla Gemini Flash i 73,8% dla Claude Haiku.
Umiejętności matematyczne i programistyczne: W teście MGSM (matematyczne rozumowanie) GPT-4o mini uzyskał wynik 87,0%, podczas gdy Gemini Flash – 75,5%, a Claude Haiku – 71,7%. W teście HumanEval (wydajność kodowania) GPT-4o mini osiągnął 87,2%, w porównaniu do 71,5% dla Gemini Flash i 75,9% dla Claude Haiku.
Rozumowanie multimodalne: W teście MMMU GPT-4o mini uzyskał wynik 59,4%, przewyższając Gemini Flash (56,1%) i Claude Haiku (50,2%).
GPT-4o mini otwiera nowe możliwości dla szerokiego spektrum zastosowań, dzięki niskim kosztom i małym opóźnieniom. Model szczególnie dobrze sprawdza się w:
1. Aplikacjach łączących lub równoległych wielu wywołań modelu (np. wywołania wielu API).
2. Przekazywaniu dużej ilości kontekstu do modelu (np. pełna baza kodu lub historia konwersacji).
3. Interakcji z klientami poprzez szybkie odpowiedzi tekstowe w czasie rzeczywistym (np. chatboty obsługi klienta).
OpenAI współpracował z zaufanymi partnerami, takimi jak Ramp i Superhuman, aby lepiej zrozumieć przypadki użycia i ograniczenia GPT-4o mini. Firmy te odkryły, że GPT-4o mini radzi sobie znacznie lepiej niż GPT-3.5 Turbo w zadaniach takich jak:
– Wyodrębnianie ustrukturyzowanych danych z plików rachunków.
– Generowanie wysokiej jakości odpowiedzi e-mail przy uwzględnieniu historii wątku.
OpenAI przykłada ogromną wagę do kwestii bezpieczeństwa, integrując je w swoje modele od samego początku i wzmacniając je na każdym etapie procesu rozwoju.
GPT-4o mini posiada te same wbudowane środki bezpieczeństwa co GPT-4o:
– Filtrowanie niepożądanych treści podczas wstępnego treningu (np. mowa nienawiści, treści dla dorosłych).
– Dostosowywanie zachowania modelu do polityk firmy po treningu.
– Zastosowanie technik uczenia ze wzmocnieniem z informacją zwrotną od człowieka (RLHF).
– Ocena przez ponad 70 zewnętrznych ekspertów z dziedzin takich jak psychologia społeczna i dezinformacja.
– Wprowadzenie nowej metody hierarchii instrukcji, która poprawia odporność modelu na próby obejścia zabezpieczeń i manipulacji.
GPT-4o mini jest już dostępny jako model tekstowy i wizualny w API Asystentów, API Chat Completions i API Batch. Ceny za korzystanie z modelu są następujące:
– 15 centów za 1 milion tokenów wejściowych
– 60 centów za 1 milion tokenów wyjściowych
To równowartość około 2500 stron standardowej książki.
Model jest również dostępny w ChatGPT dla użytkowników darmowych, Plus i Team, zastępując GPT-3.5. Użytkownicy Enterprise uzyskają dostęp w przyszłym tygodniu.
OpenAI przewiduje przyszłość, w której modele AI staną się płynnie zintegrowane w każdej aplikacji i na każdej stronie internetowej. GPT-4o mini toruje drogę do budowania i skalowania potężnych aplikacji AI w sposób bardziej efektywny i przystępny cenowo.
Firma jest zaangażowana w kontynuowanie trendu obniżania kosztów przy jednoczesnym zwiększaniu możliwości modeli. Dla porównania, koszt na token GPT-4o mini spadł o 99% w stosunku do modelu text-davinci-003 wprowadzonego w 2022 roku.
OpenAI widzi przyszłość AI jako coraz bardziej dostępną, niezawodną i wbudowaną w nasze codzienne cyfrowe doświadczenia.
Źródło: openai.com