Google I/O 2026: Gemini Omni, Gemini 3.5 i računarski sloj iza agentske veštačke inteligencije

Google I/O 2026 je postavio Gemini Omni i Gemini 3.5 u središte Google-ove strategije za agentsku veštačku inteligenciju. Ovaj članak analizira razliku između multimodalnog kreiranja i inteligencije na nivou delovanja, zašto je Gemini 3.5 Flash važan za agente i kodiranje, i kako ovi modeli pokreću širu promenu platforme Google I/O 2026.

Objavljeno:21. мај 2026. 13:01

Aleksandar Stajić

Updated: 21. мај 2026. 13:07

Google I/O 2026: Gemini Omni, Gemini 3.5 i računarski sloj iza agentske veštačke inteligencije

Google I/O 2026 je vratio računarski sloj Google-ove AI strategije ponovo u centar pažnje. Glavno izlaganje bilo je prepuno agenata, programerskih alata, nosivih interfejsa i integracija proizvoda, ali svi ti slojevi zavise od dva smera razvoja modela: Gemini Omni i Gemini 3.5. Jedan gura multimodalno kreiranje i uređivanje. Drugi gura naprednu inteligenciju sa akcijom, posebno kroz Gemini 3.5 Flash.

Ovaj članak je krak računarskog sloja unutar šireg arhitektonskog čvorišta Google I/O 2026. Strana sa programerskim alatima pokrivena je u članku Antigravity, AI Studio i Google DevTools. Priča o uređajima i interfejsima pokrivena je u Android XR i pametne naočare. Priča o proizvodima pokrivena je u Agentski proizvodi u pretrazi, Workspace-u i kupovini.

Važno je izbeći posmatranje modela Gemini Omni i Gemini 3.5 kao jedne generičke najave „novog AI modela“. Oni rešavaju različite probleme sa proizvodima i infrastrukturom. Omni se bavi kreativnim generisanjem iz bilo kog unosa, počevši od videa. Gemini 3.5 se bavi brzom inteligencijom orijentisanom na akciju za agente, kodiranje i dugoročne tokove posla. Ta razlika je važna za programere, timove za proizvode i arhitekte platformi.

Računarski sloj iza glavnog izlaganja

Google-ova sopstvena kolekcija sa I/O 2026 uokviruje događaj oko dva nova modela: Gemini Omni i Gemini 3.5. Gemini Omni je opisan kao korak napred u razumevanju sveta, multimodalnosti i uređivanju, sposoban da kreira izlaz iz unosa kroz tekst, slike, audio i video, počevši od videa. Gemini 3.5 Flash je predstavljen kao prvi model u porodici Gemini 3.5, kombinujući naprednu inteligenciju sa akcijom.

Gemini Omni se fokusira na multimodalno kreiranje i uređivanje, počevši od videa.
Gemini 3.5 Flash se fokusira na brzinu na nivou akcije za agente, kodiranje i složene tokove posla.
Podela modela odražava širu podelu Google-ove platforme: kreirajte bogatije medije, a zatim delujte brže kroz proizvode i alate.
Prava strateška vrednost dolazi kada se ovi modeli povežu sa Antigravity, AI Studio, Search, Workspace, Android XR i uređajima koje pokreće Gemini.

Priča o modelima nije samo o većem kontekstu ili boljim demo snimcima. Reč je o specijalizaciji uloga: kreiranje sa jedne strane, akcija sa druge.— Čitanje računarskog sloja

Gemini Omni: Kreiranje iz bilo kog unosa

Gemini Omni je Google-ov najdirektniji pokušaj da spoji rasuđivanje sa kreiranjem. Zvanično pozicioniranje je jasno: može da kreira bilo šta iz bilo kog unosa, počevši od videa. Model prihvata kombinacije teksta, slike, zvuka i videa, a zatim generiše visokokvalitetni video zasnovan na realnom znanju Gemini-ja. Takođe podržava konverzacijsko uređivanje videa, što će verovatno biti važnije od jednokratnog generisanja u stvarnim kreativnim tokovima posla.

Ta poslednja stavka je važna. Praktična vrednost kreativne veštačke inteligencije retko se svodi samo na „generisanje videa“. Produkcijski tokovi rada zahtevaju reviziju, zamenu, tajming, kontinuitet stila i razgovor o izmenama. Ako Omni može da učini uređivanje više konverzacijskim uz očuvanje konteksta, on postaje više od običnog generatora noviteta. Postaje kreativni interfejs.

// Gemini Omni treba posmatrati kao model kreativnog toka rada
input = { text: "Prikaži lansiranje proizvoda u kišnom sajberpank gradu", image: "brand-reference.png", audio: "voiceover.wav", video: "rough-cut.mp4"
} output = GeminiOmni.generateVideo(input)
revision = GeminiOmni.edit(output, "Učini osvetljenje toplijim i zadrži isti dizajn proizvoda")

Za timove koji grade medijske alate, vizuelne prikaze proizvoda za e-trgovinu, obrazovni sadržaj, prototipove igara, tokove rada u oglašavanju ili kanale za društvene video snimke, ovo je deo I/O 2026 koji je najvažniji. Interfejs se pomera sa ručnog uređivanja vremenske linije ka multimodalnom uređivanju zasnovanom na nameri. To ne uklanja kreativnu procenu, ali menja mesto gde se troši kreativni rad.

Gemini 3.5 Flash: Napredna inteligencija sa delovanjem

Gemini 3.5 Flash je druga polovina priče o računarstvu. Google opisuje porodicu Gemini 3.5 kao spoj napredne inteligencije i delovanja, i pozicionira 3.5 Flash kao prvo izdanje u toj porodici. Naglasak je na agentima, kodiranju, složenim dugoročnim zadacima i praktičnoj primeni u stvarnom svetu. Taj rečnik nije slučajan. On direktno ukazuje na sisteme koji rade stvari, a ne samo na sisteme koji odgovaraju.

Za programere, „Flash“ je važan jer su agentski tokovi rada osetljivi na kašnjenje. Model koji je pametan ali spor može da posluži za istraživanje ili pažljivo pisanje. Mnogo ga je teže uklopiti u automatizaciju u terminalu, IDE petlje, višekoračno korišćenje alata, pozadinske agente i korisnička iskustva proizvoda koja zahtevaju trenutnu povratnu informaciju. Google očigledno pokušava da brzo napredno ponašanje učini podrazumevanim motorom za agentske tokove rada.

// Klasično korišćenje modela
answer = model.generate("Objasni ovu funkciju") // Agentsko korišćenje modela
plan = model.plan(task)
toolResult = tools.run(plan.nextStep)
verification = model.verify(toolResult) if verification.failed: rollback()
else: continueExecution()

Ta promena je razlog zašto Gemini 3.5 pripada istoj grupi kao i Antigravity. Antigravity-ju je potreban model koji može da planira, izvršava, verifikuje i nastavi da se kreće bez pretvaranja razvojnog okruženja u čekaonicu. Ovde računarske performanse postaju korisničko iskustvo programera.

Zašto brzina i akcija idu zajedno

Google-ovo uvodno izlaganje u vezi sa brzinom nije samo marketing. Agentski sistemi umnožavaju latenciju. Jedan odgovor zahteva jedan krug komunikacije sa modelom. Radni tok sa više agenata može imati mnogo koraka: planiranje, izbor alata, uređivanje koda, izvršavanje u terminalu, verifikaciju, popravku, rezimiranje i ljudski pregled. Ako je svaki korak spor, ceo sistem postaje neupotrebljiv.

Brz izlaz poboljšava interaktivne petlje kodiranja.
Niska latencija čini da agenti sa više koraka deluju manje krhko.
Visoka propusnost je važna kada agenti rade na pozadinskim zadacima održavanja.
Stabilno rezonovanje je važno jer su brže pogrešne akcije i dalje pogrešne akcije.
Verifikacija ostaje od suštinskog značaja jer sama brzina ne znači i poverenje.

Koristan agent nije model koji odgovara samo jednom. To je model koji može da nastavi da deluje, a da radni tok ne deluje kao red za čekanje.— Perspektiva agentskog izvršnog okruženja

Gemini Omni protiv Gemini 3.5: Različiti poslovi, isti stek

Najjasniji način da se razumeju najave o računarskim resursima sa I/O 2026 jeste da se razdvoje poslovi. Gemini Omni je multimodalni model za kreiranje i uređivanje. Gemini 3.5 Flash je model orijentisan na akciju za agente i kodiranje. Oni su komplementarni, a ne zamenljivi. Proizvodni tim bi mogao da koristi Omni za generisanje medija, a Gemini 3.5 Flash za orkestriranje radnog toka oko tih medija.

// Primer toka rada proizvoda
creativeAsset = GeminiOmni.generateVideo(brief) agentPlan = Gemini35Flash.plan({ task: "Publish launch campaign", asset: creativeAsset, channels: ["YouTube Shorts", "landing page", "email"]
}) Gemini35Flash.execute(agentPlan, tools)

To je šira arhitektura na koju Google ukazuje. Kreativni modeli generišu bogatije artefakte. Akcioni modeli koordiniraju zadatke oko tih artefakata. Proizvodne površine izlažu te mogućnosti korisnicima. Razvojni alati pružaju orkestraciju i verifikaciju. Površine uređaja čine asistenta dostupnim u više konteksta.

Šta ovo znači za programere

Programeri ne bi trebalo da posmatraju Gemini 3.5 Flash samo kao još jednu opciju modela. On menja oblik aplikacija koje se mogu izgraditi na vrhu Google-ovog steka. Ako model može da rukuje dužim sekvencama zadataka, pouzdano koristi alate i radi dovoljno brzo za stvarne tokove posla, tada se aplikacije mogu pomeriti sa izolovanih AI funkcija na procese posredovane modelom.

Kod-agenti mogu refaktorisati, testirati i verifikovati veće jedinice zadataka.
Proizvodni agenti mogu pomoći korisnicima da pređu sa namere na akciju unutar jednog toka.
Medijske aplikacije mogu kombinovati Omni generisanje sa Gemini 3.5 orkestracijom.
Funkcije pretrage i Workspace-a mogu preći sa odgovaranja na izvršavanje.
Mobilne i XR površine mogu koristiti Gemini kao sloj konteksta uživo umesto kao udaljenog asistenta u oblaku.

Opasnost leži u prekomernoj izgradnji pre nego što operativni model sazri. Programerima su i dalje potrebni verzisanje, evaluacija, logovanje, kontrola troškova, zamensko ponašanje (fallback) i ljudska potvrda za akcije visokog uticaja. Jači model ne uklanja potrebu za inženjerskom disciplinom. On povećava vrednost te discipline.

Šta ovo znači za proizvodne timove

Proizvodni timovi bi trebalo da tumače Gemini Omni i Gemini 3.5 kao signal da Google želi da AI postane sloj izvršavanja širom ekosistema. To stvara i priliku i rizik. Prilika je brži put od namere korisnika do gotovog rezultata. Rizik je u tome što ponašanje proizvoda postaje manje transparentno ako su odluke agenata skrivene iza doteranog interfejsa.

agenticProductChecklist = { userIntent: "clear", modelRole: "defined", tools: "permissioned", outputs: "reviewable", failures: "recoverable", costs: "measured", userControl: "explicit"
}

Ako proizvodni tim ne može da odgovori na to šta je modelu dozvoljeno da radi, kako se evaluira i kako korisnik može da se oporavi od loše akcije, integracija nije spremna za produkciju. Ovo posebno važi kada je Gemini povezan sa Search, Workspace, Shopping, Android platformama ili interfejsima nosivih uređaja.

Suočavanje sa realnošću: Benchmarci nisu proizvod

Rizik kod svakog lansiranja modela je opijenost benchmark-ovima. Bolje performanse su važne, ali produkciona vrednost zavisi od kvaliteta integracije. Model može biti brži i jači, a da i dalje podbaci u specifičnom procesu rada jer su promptovi slabi, politike alata labave, evaluacija površna ili nedostaju opcije za vraćanje na prethodno stanje.

Kreativnom modelu su potrebni doslednost, mogućnost uređivanja i kontrola izlaza.
Akcionom modelu su potrebni disciplina u korišćenju alata, verifikacija i bezbedni režimi otkazivanja.
Programerskom modelu je potrebno ponovljivo ponašanje unutar stvarnih repozitorijuma.
Proizvodnom modelu su potrebni poverenje korisnika i jasne granice kontrole.
Platformskom modelu su potrebni verziranje, monitoring i vidljivost troškova.

Lansirni model privlači pažnju. Operativni model odlučuje o tome da li će opstati u produkciji.— Inženjerska provera realnosti

Kako se ovo uklapa u Google I/O 2026 klaster

Ovaj članak pokriva sloj modela u klasteru. Glavno Google I/O 2026 čvorište objašnjava potpunu arhitektonsku promenu. Antigravity, AI Studio i Google DevTools objašnjavaju kako modeli ulaze u razvojne tokove rada. Android XR i pametne naočare objašnjavaju kako se ista inteligencija prenosi na nosive uređaje. Agentski proizvodi u pretrazi, Workspace-u i kupovini objašnjavaju šta se dešava kada ove mogućnosti stignu do potrošačkih i produktivnih proizvoda.

Srodni članci u ovom klasteru

Glavno čvorište: Google I/O 2026: Arhitektonski zaokreti, agentski AI i provera realnosti ujedinjenog ekosistema
Alati za programere: Google I/O 2026: Antigravity, AI Studio i Google DevTools
Android, XR i površine uređaja: Google I/O 2026: Android XR i inteligentne naočare
Agentski potrošački proizvodi: Google I/O 2026: Agentski proizvodi u Pretrazi, Workspace-u i Kupovini

Završna perspektiva

Gemini Omni i Gemini 3.5 definišu računarsku podelu iza Google I/O 2026. Omni je sloj za kreiranje: multimodalni unos, video izlaz, konverzacijsko uređivanje i generisanje utemeljeno u stvarnom svetu. Gemini 3.5 Flash je sloj za akciju: brza napredna inteligencija za agente, kodiranje i dugoročne zadatke. Zajedno, oni objašnjavaju zašto ostatak uvodnog izlaganja izgleda tako kako izgleda. Antigravity zahteva modele akcionog nivoa. Pretrazi i Workspace-u su potrebni agenti koji mogu da rasuđuju i izvršavaju. Android XR zahteva razumevanje konteksta uživo. Uvodno izlaganje nije samo priča o modelima, ali bez ovog računarskog sloja ostatak priče ne funkcioniše.

Подели

Подели на X Подели на Xing Подели на Facebook Подели на LinkedIn Подели на Telegram Подели путем е-поште

Sveobuhvatan vodič za Evaluation Harness: Ovladavanje evaluacijom performansi LLM-ova

Ovaj vodič pruža detaljan pregled Evaluation Harness-a, ključnog okvira za rigoroznu procenu sposobnosti velikih jezičkih modela (LLM) u korporativnim LLMOps procesima. Naučite podešavanje, najbolje prakse i napredne tehnike kako biste osigurali pouzdano benčmarkovanje i optimizaciju modela.

javascript-batchverarbeitung-oder-stapelverarbeitung-von-function

Sveobuhvatni vodič za metrike u isporuci i upravljanju promenama

Ovaj vodič pruža detaljan pregled osnovnih metrika za isporuku i upravljanje promenama u preduzećima, pomažući timovima da mere performanse, optimizuju procese i podstiču kontinuirano poboljšanje. Otkrijte ključne indikatore, metode izračunavanja i najbolje prakse za usklađivanje metrika sa poslovnim ishodima.

Konverzija HEIC u JPG: Zašto bi trebalo da razmislite o tome i kako funkcioniše

HEIC nudi modernu kompresiju slika i visok kvalitet, ali JPG ostaje najkompatibilniji format. Ovaj vodič objašnjava kada i kako konvertovati HEIC u JPG koristeći Linux alate i automatizaciju.

PostgreSQL 14 Ubuntu Server 23.04

Frontend i Backend Razvoj

Front-end i back-end razvoj je suštinski deo veb razvoja i obuhvata kreiranje veb aplikacija i veb-sajtova. Front-end razvoj se fokusira na korisnički interfejs, dok je back-end razvoj odgovoran za programiranje i upravljanje serverskom stranom.

Ollama nije proizvod: Izgradnja aplikacija spremnih za produkciju sa otvorenim LLM-ovima

Pokretanje lokalnog modela pomoću Ollama-e je jednostavno. Izgradnja Open-LLM aplikacije spremne za produkciju je teža: zahteva RAG, kontrolu pristupa, apstrakciju provajdera, evaluaciju, logovanje, disciplinu puštanja u rad i kontrolisani aplikativni sloj oko modela.

tensorflow

ZBT Z8102AX recenzija hardvera i pakovanja: Snažan ruter, slaba kutija

ZBT Z8102AX ostavlja solidan prvi utisak kao tanak crni metalni 5G OpenWrt ruter sa više konektora za antene, dual-SIM slotovima, USB, LAN/WAN portovima i praktičnim kompletom dodatne opreme. Hardver deluje korisno i ozbiljno, ali je pakovanje očigledno slaba tačka.

Optimizacija za pretraživače: Pouzdan radni proces za visoko rangiranje

Detaljna analiza optimizacije za pretraživače (SEO), njenih tehničkih osnova, uloge veb krolera i strateških koraka za postizanje organskih vrhunskih pozicija.

Tehnike za stvaranje hashova lozinki poštom SHA512 koristeći doveadm

Detaljirani priruk za sigurnu generisanje SHA512 lozinkovih hashova putem naredbene linije koristeći alate Dovecot-a doveadm. Ovaj članak je namenjen administratorima sistema i razvojačama.

Sveobuhvatni vodič za okidače povlačenja u poslovnim AI runbooks-ovima

Ovaj vodič istražuje Rollback Triggers, ključne mehanizme u enterprise AI runbooks koji automatski otkrivaju anomalije i pokreću rollback-ove radi održavanja stabilnosti sistema. Naučite kako da konfigurišete, nadgledate i optimizujete ove triggere za robusne AI deploymente.