Na dorocznej konferencji I/O Google zaprezentował Gemini 3.5 Flash — nowy model sztucznej inteligencji, który według firmy ma być najsilniejszym rozwiązaniem do zadań związanych z kodowaniem i działaniem agentów autonomicznych. Google pokazuje zmianę akcentu: zamiast przedstawiać AI przede wszystkim jako narzędzie konwersacyjne, stawia na systemy agentowe, które planują, wykonują i iterują nad pracą z minimalnym udziałem człowieka.
Czym jest Gemini 3.5 Flash?
Gemini 3.5 Flash to model zaprojektowany z myślą o wysokiej jakości wynikach przy niskiej latencji, co ma szczególne znaczenie przy zadaniach wymagających częstych interakcji z narzędziami i długotrwałego uruchamiania procesów. Google informuje, że w testach wewnętrznych Flash przewyższa model 3.1 Pro na większości benchmarków związanych z kodowaniem, zadaniami agentowymi oraz rozumowaniem multimodalnym. Firma podkreśla też istotne przyspieszenie: model jest czterokrotnie szybszy niż inne jej „frontier” modele, a zoptymalizowana wersja Flash ma działać nawet dwanaście razy szybciej przy zachowaniu tej samej jakości.
Agentowe AI zamiast tylko czatbotów
Kluczową zmianą jest przesunięcie narracji z pojedynczych interakcji w trybie czatu na agentowe podejście: wiele agentów może jednocześnie realizować różne etapy złożonych procesów, komunikować się między sobą i współpracować nad większym celem. Na I/O Google zaprezentował demonstrację, w której agenci wyróżniali się zadaniami nad oddzielnymi komponentami, a następnie scalili wyniki, by zbudować kompletny system operacyjny w środowisku Antigravity — platformie do rozwoju agentów i środowisku IDE firmy.
Google podkreśla, że Flash został współtworzony z Antigravity, aby agenty miały natywne środowisko do życia, pracy i wykonywania zadań. Jednocześnie przedstawiono Antigravity 2.0 — niezależną aplikację desktopową zaprojektowaną wokół podejścia „agent-first”, która ma służyć jako środowisko deweloperskie i operacyjne dla modeli agentowych.
- Gemini 3.5 Flash: model zoptymalizowany pod kodowanie i agentowe zadania.
- Wewnętrzne testy: Flash przewyższa 3.1 Pro w większości benchmarków dla kodowania i rozumowania multimodalnego.
- Wydajność: Google podaje 4x przewagi nad innymi frontier modelami oraz 12x przy zoptymalizowanej wersji Flash.
- Antigravity 2.0: desktopowe środowisko zaprojektowane wokół pracy agentów.
- Dostępność: Flash dostępny przez Antigravity, Gemini API, Gemini Enterprise, aplikację Gemini i AI Mode w Search.
Zastosowania i wpływ na firmy
Google podaje przykłady partnerów, którzy już korzystają z nowych możliwości agentowych: banki i firmy fintech wykorzystują je do automatyzacji wielotygodniowych procesów, a zespoły data science sięgają po Flash, by szybciej wydobywać wnioski z złożonych środowisk danych. Model ma umożliwiać długotrwałe uruchamianie procesów — agenty mogą działać autonomicznie przez wiele godzin, realizując wieloetapowe pipeline’y kodowania czy badawcze projekty.
Google zaznacza też, że Flash ma współpracować z zapowiedzianym modelem 3.5 Pro: w tej konfiguracji Pro pełniłby rolę orkiestratora i planisty o wyższych zdolnościach rozumowania, a Flash byłby wykorzystywany jako szybka wersja wykonawcza — podagent realizujący konkretne, „brute force” zadania i korzystający z narzędzi.
Bezpieczeństwo, nadzór i potencjalne ryzyka
Udostępnianie potężniejszych agentów szerszemu gronu użytkowników zwiększa jednocześnie skalę potencjalnych zagrożeń. Google stoi w obliczu krytyki i prawnych konsekwencji związanych z przypadkiem, gdy intensywna rozmowa z wcześniejszą wersją Gemini była powiązana z tragicznym zdarzeniem. Firma reaguje, mówiąc o wzmocnieniu zabezpieczeń w obszarach cyberbezpieczeństwa i CBRN (chemia, biologia, radiologia, nuklearne) oraz o lepszym kalibrowaniu modelu w reagowaniu na pytania wrażliwe zamiast prostego odrzucania interakcji.
Google deklaruje także mechanizmy nadzoru: model może się wstrzymać i poprosić o interwencję użytkownika w punktach decyzyjnych albo tam, gdzie potrzebna jest zgoda lub ocena etyczna. To rozwiązanie ma na celu łączenie autonomii agentów z kontrolą ludzką w krytycznych momentach. Jednocześnie udostępnienie technologii konsumentom — na przykład w formie Gemini Spark, osobistego agenta mającego działać 24/7 — rodzi pytania o skalę monitoringu, prywatność danych i odpowiedzialność za działania agentów.
Google deklaruje dostępność Gemini 3.5 Flash od razu w kilku kanałach: przez Antigravity, Gemini API, ofertę Gemini Enterprise oraz w aplikacji Gemini i trybie AI w Search. Wprowadzenie agentowych funkcji bezpośrednio do wyników wyszukiwania ma ułatwić tworzenie, dostosowywanie i zarządzanie agentami na platformie, co może przyspieszyć adopcję tego podejścia zarówno wśród deweloperów, jak i użytkowników końcowych.
Co to oznacza dla branży technologicznej? Przede wszystkim sygnał, że kolejna fala innowacji w AI może koncentrować się na automatyzacji zadań i orkiestracji pracy agentów zamiast jedynie na udoskonalaniu interfejsu konwersacyjnego. Dla firm oznacza to nowe możliwości automatyzacji złożonych procesów, ale też konieczność rozwinięcia procedur bezpieczeństwa, audytu działań agentów i zarządzania ryzykiem. Deweloperzy i zespoły data science otrzymują narzędzia pozwalające na szybsze iteracje i wykonywanie dłuższych operacji, co może zmieniać dotychczasowe workflowy.
Gemini 3.5 Flash to krok w stronę agentowego modelu pracy AI — wdrożenie takich systemów w praktyce będzie zależeć zarówno od ich technicznych możliwości, jak i od tego, jak branża poradzi sobie z kwestiami bezpieczeństwa, regulacji i nadzoru. Google udostępnia narzędzia i integracje już teraz, ale dalsze losy tej architektury będą w dużej mierze zależeć od reakcji rynku, regulatorów i społeczności badawczej.