Google Gemini 2.5 Pro w wersji eksperymentalnej to czyste szaleństwo

Jak informuje na swoim blogu Google, Gemini 2.5 Pro oferuje natywną multimodalność (tzn. obsługę tekstu, obrazu, wideo oraz audio), jak również długie okno kontekstowe o rozmiarze 1 miliona tokenów, z planami zwiększenia do 2 milionów. Google podkreśla znaczny postęp w możliwościach kodowania w porównaniu do Gemini 2.0. Model wykazuje wysoką biegłość w tworzeniu interaktywnych aplikacji internetowych, aplikacji bazujących na agentowym AI, a także w transformacji i edycji kodu. Gemini 2.5 Pro Experimental jest obecnie dostępny z poziomu Google AI Studio oraz w aplikacji Gemini, ale tam tylko dla użytkowników Gemini Advanced, a więc dla posiadaczy płatnej subskrypcji.

Gemini 2.5 Pro bije konkurencję w wielu popularnych benchmarkach, w tym LMArena (gdzie zajmuje pierwsze miejsce), benchmarkach kodowania (AIME 2025, LiveCodeBench v5), matematycznych i naukowych (GPQA). Wyróżnia się również w teście “Humanity’s Last Exam”, osiągając 18,8% bez użycia technik zwiększających koszty, takich jak majority voting. Model wydaje się demonstrować rozszerzone rozumowanie i to bez potrzeby stosowania zaawansowanych technik testowania, takich jak tzw. głosowanie większościowe. Warto pamiętać, że jak słusznie zauważa Asia na łamach serwisu CHIP: Nowy model cechuje się zdolnością do ‘myślenia’ przed udzieleniem odpowiedzi, za co odpowiadają mechanizmy rozumowania bezpośrednio w architekturze modelu. Znane wcześniej jako “Flash Thinking” w Gemini 2.0, stały się teraz integralną częścią wszystkich modeli 2.5, a cały ‘proces myślowy’ modelu możemy śledzić za pomocą opcji “Pokaż myślenie” w aplikacji.

Czytaj też: Google rewolucjonizuje wyszukiwanie – otwiera dostęp do Trybu AI dla szerszego grona użytkowników

Imponujące możliwości modelu dobitnie prezentuje poniższe wideo Google DeepMind, na którym widać jak Gemini Pro 2.5 radzi sobie ze stworzeniem prostej gry na bazie pojedynczego dość podstawowego prompta. Oczywiście model wzięli na warsztat entuzjaści AI i z pierwszych testów wynika, że poprawnie rozwiązuje on złożone zadania językowe, logiczne, kodowania i multimodalne, które wcześniej stanowiły wyzwanie dla innych modeli. Z kolei Google podkreśla znaczenie szybkiej iteracji i zbierania opinii od użytkowników eksperymentalnych wersji modeli w celu ciągłego ulepszania ich jakości. Zachęca więc deweloperów i użytkowników do eksperymentowania z Gemini 2.5 Pro oraz dzielenia się swoimi uwagami.