Google Gemini zrobi Ci film i zajrzy do pliku, a to dopiero początek nowości

Google majstruje przy swojej sztucznej inteligencji i w aplikacjach. Wygląda na to, że niebawem Google Gemini będzie generować filmy na zawołanie. Gemini dostał też zupełnie nowy model językowy, przeznaczony dla naukowców. Ponadto pojawiły się nowe możliwości w Google Meet i w przeglądarce Google Chrome.
Google Gemini

Źródło: Google

Google Gemini samodzielnie może pracować tylko z tekstem (modele Flash). Ma też możliwość generowania obrazów z pomocą aplikacji Imagen 3 – wystarczy o to poprosić podczas korzystania z modelu Flash 2.0. Wiele wskazuje na to, że na obrazkach się nie skończy.

Google Gemini z Imagen 3
Google Gemini generuje obrazy z aplikacją Imagen 3

Google Gemini dostanie Videogen

W aplikacji Google (wersja 16.6.23) dla Androida pojawiła się wzmianka o aplikacji Videogen. Można ją znaleźć razem z odniesieniami do projektu „Robin” – to nazwa kodowa dla sztucznej inteligencji Gemini. Ponadto w kodzie aplikacji znalazły się komunikaty o treści:

"Working ......"
"We will notify you when it's ready"

Przez analogię do Imagen zakładamy, że projekt Videogen ma służyć do tworzenia filmów na żądanie. Powyższe komunikaty zaś są informacją, że proces tworzenia zajmie dłuższy czas. Co więcej, w plikach znajduje się banner opisany jako status generowania wideo dla projektu Robin, czyli dla Google Gemini.

Czytaj też: Google szykuje się do połączenia Gemini z Mapami

Warto wiedzieć, że Google ma już sztuczną inteligencję, wspomagającą tworzenie wideo, ale nie należy jej mylić z Videogen. Google Vids nie jest modelem generatywnym. To raczej narzędzie pomagające zaplanować produkcję filmu, napisać scenariusz, i wspomagające edycję. Można w nim skorzystać z grafik generowanych przez AI, wygenerować narrację głosową albo skorzystać z promptera. To zupełnie co innego.

Ten ślad może być powiązany z wcześniejszą zapowiedzią nowych możliwości Gemini. Google kusi w niej możliwością tworzenia materiałów wideo i dźwiękowych, a także funkcji oszczędzających czas.

Niestety jeszcze nie wiemy, kiedy Videogen będzie dostępny dla wszystkich użytkowników Google Gemini.

Google Gemini zajrzy do pliku za darmo

Czytaj też: Gemini zrobi dla Ciebie wykres i wizualizację w Arkuszach Google’a

Google udostępnił też za darmo funkcję, która była dostępna tylko dla użytkowników Gemini Advanced, opłacających abonament. Podczas korzystania z modelu Flash 2.0 można zlecić im pracę z plikiem. Może to być dokument, plik graficzny, albo zdjęcie zrobione aparatem, jeśli pracujesz na smartfonie. Przykład ze świeżo zrobionym zdjęciem zamieściłam poniżej.

Google informuje, że Gemini może przejrzeć jednocześnie do 10 plików i żaden nie może przekroczyć 100 MB. Obsługiwane są różne formaty dokumentów, a także pliki z kodem w kilku językach programowania i znaczników.

Niestety w chwili pisania artykułu praca z plikami nie jest dostępna w wersji przeglądarkowej Google Gemini. To powinno się jednak szybko zmienić.

Zmiany w Google, Gemini i Chrome na iOS

Sporo dzieje się też na systemie iOS. Po pierwsze, asystent Gemini został usunięty z aplikacji wyszukiwarki Google. Ma to przekonać posiadaczy iPhone’ów i iPadów do ściągania samodzielnej aplikacji Gemini. Pewnie Google liczy, że dzięki temu aplikacja Gemini będzie wyżej w rankingach w App Store. Ma jednak silną konkurencję w postaci Apple Intelligence z integracją z ChatGPT.

Po drugie, Google Chrome na iOS dostał funkcję, którą niedawno chwalił się Samsung: Circle to Search. Google nie nazywa jej tak w zapowiedzi, ale wszyscy wiemy, o co chodzi. Można zaznaczyć obiekt na przeglądanej właśnie stronie i użyć fragmentu jako wyszukiwanie.

Czytaj też: Google udostępni Circle to Search na komputery stacjonarne

Ponadto Google wprowadza zmiany w płatnej wersji Gemini Advanced. Subskrybenci dostaną niebawem nowy model Gemoni 2.0 Pro Experimental, przeznaczony do pracy z kodem i formułami matematycznymi.

Wcześniej płacący abonament otrzymali też dostęp do funkcji Recall. To oznacza, że Gemini będzie pamiętać przeszłe rozmowy i pozwoli do nich wrócić w każdej chwili. Dyskusję na dany temat będzie można prowadzić przez dłuższy czas, nawet jeśli w międzyczasie pojawią się inne zadania dla Gemini.

Gemini Advanced od niedawna daje dostęp także do modelu NotebookLM Plus. To z kolei model przeznaczony do poszukiwania i analizy informacji, przeznaczony głównie do pracy naukowej.

Anna RymszaA
Napisane przez

Anna Rymsza