Model GPT-4.1 poszedł w świat. OpenAI próbuje zabrać pracę programistom

Model GPT-4.1 jest dostępny w wersji „pełnowymiarowej”, mini i nano – najmniejszym i najtańszym. Można z nich skorzystać w zewnętrznych aplikacji poprzez API OpenAI. Nie ma jednak możliwości, by porozmawiać z nimi w aplikacji ChatGPT.

GPT-4.1 ma dobrze kodować

Multimodalne modele mają bufor kontekstowy o rozmiarze miliona tokenów. To oznacza, że można dać im do przetworzenia około 750 tysięcy słów. To wystarczy, by pracować z długą powieścią albo pełnym podręcznikiem. Jednak trzeba wiedzieć, że nie do tego został stworzony model GPT-4.1. Jego głównym przeznaczeniem jest praca z kodem i ułatwianie pracy programistów.

Czytaj też: Licealista wykorzystał AI. Wykrył 1,5 miliona nieznanych obiektów w kosmosie

Nowy model firmy OpenAI został wytrenowany do programowania. GPT-4.1 ma być zdolny do wykonywania złożonych zadań programistycznych. OpenAI informuje, że ambicją firmy jest wytrenowanie agenta AI, zdolnego wykonywać zadania inżyniera oprogramowania. Firma celuje w AI zdolną programować całe aplikacje od początku do końca, łącznie z testowaniem, poprawianiem błędów i tworzeniem pełnej dokumentacji.

To niełatwe zadanie. Aktualnie wielu programistów krytykuje kod pisany przez AI za słabe bezpieczeństwo, ale wszystko przed nami. OpenAI informuje, że GPT-4.1 był trenowany i optymalizowany na prawdziwych przypadkach i z uwzględnieniem informacji zwrotnych specjalistów.

Priorytetem było przygotowanie modelu zdolnego kodować frontend spójny ze strukturą istniejącego kodu, formatami danych, prawidłowo wykorzystujący istniejące narzędzia i tak dalej. Na liście celów jest też zmniejszenie liczby koniecznych edycji i zachowanie kolejności odpowiedzi na złożone zapytania. Dzięki temu GPT-4.1 ma umożliwić tworzenie agentów AI, wspierających programistów.

OpenAI twierdzi, że model GPT-4.1 jest lepszy w testach porównawczych kodu (SWE-bench) od starszych modeli GPT-4o i GPT-4o mini. Mają też być szybsze i wydajniejsze, ale są bardziej „dosłowne”, więc wymagają precyzyjniejszych instrukcji od GPT-4o. GPT-4.1 nano jest podobno najszybszym i najtańszym modelem w historii OpenAI, ale odbywa się to kosztem dokładności.

Wiarygodność odpowiedzi spada też wraz z liczbą dostarczonych tokenów wejściowych – to może być problem przy poszukiwaniu wiedzy z pomocą modelu. OpenAI może jednak pochwalić się wysoką dokładnością w analizie wideo, w tym długich filmów bez napisów. Jeśli chodzi o wiedzę, jego data graniczna to czerwiec 2024, co daje mu dobre odniesienie do bieżących wydarzeń.

Czytaj też: Netflix testuje nową wyszukiwarkę. Znajdziesz dokładnie to, na co masz ochotę

Nowy model GPT-4.1 to odpowiedź firmy OpenAI na działania Google, Microsoftu, DeepSeek, Anthropic i innych firm, szkolących modele pomagające programować. Ma konkurować między innymi z Gemini 2.5 Pro, Claude 3.7 Sonnet i nowym V3 z Chin. Warto dodać, że szybki GPT-4.1 nano jest mniej dokładny od konkurentów Google i Anthropic.