Model GPT-4.1 jest dostępny w wersji „pełnowymiarowej”, mini i nano – najmniejszym i najtańszym. Można z nich skorzystać w zewnętrznych aplikacji poprzez API OpenAI. Nie ma jednak możliwości, by porozmawiać z nimi w aplikacji ChatGPT.
GPT-4.1 ma dobrze kodować
Multimodalne modele mają bufor kontekstowy o rozmiarze miliona tokenów. To oznacza, że można dać im do przetworzenia około 750 tysięcy słów. To wystarczy, by pracować z długą powieścią albo pełnym podręcznikiem. Jednak trzeba wiedzieć, że nie do tego został stworzony model GPT-4.1. Jego głównym przeznaczeniem jest praca z kodem i ułatwianie pracy programistów.
Czytaj też: Licealista wykorzystał AI. Wykrył 1,5 miliona nieznanych obiektów w kosmosie
Nowy model firmy OpenAI został wytrenowany do programowania. GPT-4.1 ma być zdolny do wykonywania złożonych zadań programistycznych. OpenAI informuje, że ambicją firmy jest wytrenowanie agenta AI, zdolnego wykonywać zadania inżyniera oprogramowania. Firma celuje w AI zdolną programować całe aplikacje od początku do końca, łącznie z testowaniem, poprawianiem błędów i tworzeniem pełnej dokumentacji.
To niełatwe zadanie. Aktualnie wielu programistów krytykuje kod pisany przez AI za słabe bezpieczeństwo, ale wszystko przed nami. OpenAI informuje, że GPT-4.1 był trenowany i optymalizowany na prawdziwych przypadkach i z uwzględnieniem informacji zwrotnych specjalistów.
Priorytetem było przygotowanie modelu zdolnego kodować frontend spójny ze strukturą istniejącego kodu, formatami danych, prawidłowo wykorzystujący istniejące narzędzia i tak dalej. Na liście celów jest też zmniejszenie liczby koniecznych edycji i zachowanie kolejności odpowiedzi na złożone zapytania. Dzięki temu GPT-4.1 ma umożliwić tworzenie agentów AI, wspierających programistów.
OpenAI twierdzi, że model GPT-4.1 jest lepszy w testach porównawczych kodu (SWE-bench) od starszych modeli GPT-4o i GPT-4o mini. Mają też być szybsze i wydajniejsze, ale są bardziej „dosłowne”, więc wymagają precyzyjniejszych instrukcji od GPT-4o. GPT-4.1 nano jest podobno najszybszym i najtańszym modelem w historii OpenAI, ale odbywa się to kosztem dokładności.
Wiarygodność odpowiedzi spada też wraz z liczbą dostarczonych tokenów wejściowych – to może być problem przy poszukiwaniu wiedzy z pomocą modelu. OpenAI może jednak pochwalić się wysoką dokładnością w analizie wideo, w tym długich filmów bez napisów. Jeśli chodzi o wiedzę, jego data graniczna to czerwiec 2024, co daje mu dobre odniesienie do bieżących wydarzeń.
Czytaj też: Netflix testuje nową wyszukiwarkę. Znajdziesz dokładnie to, na co masz ochotę
Nowy model GPT-4.1 to odpowiedź firmy OpenAI na działania Google, Microsoftu, DeepSeek, Anthropic i innych firm, szkolących modele pomagające programować. Ma konkurować między innymi z Gemini 2.5 Pro, Claude 3.7 Sonnet i nowym V3 z Chin. Warto dodać, że szybki GPT-4.1 nano jest mniej dokładny od konkurentów Google i Anthropic.