Google I/O 2026: Gemini Omni, Gemini 3.5 i računarski sloj iza agentske veštačke inteligencije

Google I/O 2026 je postavio Gemini Omni i Gemini 3.5 u središte Google-ove strategije za agentsku veštačku inteligenciju. Ovaj članak analizira razliku između multimodalnog kreiranja i inteligencije na nivou delovanja, zašto je Gemini 3.5 Flash važan za agente i kodiranje, i kako ovi modeli pokreću širu promenu platforme Google I/O 2026.
Objavljeno:
Aleksandar Stajić
Updated: 21. мај 2026. 13:07
Google I/O 2026: Gemini Omni, Gemini 3.5 i računarski sloj iza agentske veštačke inteligencije

Ilustracija

Google I/O 2026 je vratio računarski sloj Google-ove AI strategije ponovo u centar pažnje. Glavno izlaganje bilo je prepuno agenata, programerskih alata, nosivih interfejsa i integracija proizvoda, ali svi ti slojevi zavise od dva smera razvoja modela: Gemini Omni i Gemini 3.5. Jedan gura multimodalno kreiranje i uređivanje. Drugi gura naprednu inteligenciju sa akcijom, posebno kroz Gemini 3.5 Flash.

Ovaj članak je krak računarskog sloja unutar šireg arhitektonskog čvorišta Google I/O 2026. Strana sa programerskim alatima pokrivena je u članku Antigravity, AI Studio i Google DevTools. Priča o uređajima i interfejsima pokrivena je u Android XR i pametne naočare. Priča o proizvodima pokrivena je u Agentski proizvodi u pretrazi, Workspace-u i kupovini.

Važno je izbeći posmatranje modela Gemini Omni i Gemini 3.5 kao jedne generičke najave „novog AI modela“. Oni rešavaju različite probleme sa proizvodima i infrastrukturom. Omni se bavi kreativnim generisanjem iz bilo kog unosa, počevši od videa. Gemini 3.5 se bavi brzom inteligencijom orijentisanom na akciju za agente, kodiranje i dugoročne tokove posla. Ta razlika je važna za programere, timove za proizvode i arhitekte platformi.

Računarski sloj iza glavnog izlaganja

Google-ova sopstvena kolekcija sa I/O 2026 uokviruje događaj oko dva nova modela: Gemini Omni i Gemini 3.5. Gemini Omni je opisan kao korak napred u razumevanju sveta, multimodalnosti i uređivanju, sposoban da kreira izlaz iz unosa kroz tekst, slike, audio i video, počevši od videa. Gemini 3.5 Flash je predstavljen kao prvi model u porodici Gemini 3.5, kombinujući naprednu inteligenciju sa akcijom.

  • Gemini Omni se fokusira na multimodalno kreiranje i uređivanje, počevši od videa.
  • Gemini 3.5 Flash se fokusira na brzinu na nivou akcije za agente, kodiranje i složene tokove posla.
  • Podela modela odražava širu podelu Google-ove platforme: kreirajte bogatije medije, a zatim delujte brže kroz proizvode i alate.
  • Prava strateška vrednost dolazi kada se ovi modeli povežu sa Antigravity, AI Studio, Search, Workspace, Android XR i uređajima koje pokreće Gemini.
Priča o modelima nije samo o većem kontekstu ili boljim demo snimcima. Reč je o specijalizaciji uloga: kreiranje sa jedne strane, akcija sa druge.— Čitanje računarskog sloja

Gemini Omni: Kreiranje iz bilo kog unosa

Gemini Omni je Google-ov najdirektniji pokušaj da spoji rasuđivanje sa kreiranjem. Zvanično pozicioniranje je jasno: može da kreira bilo šta iz bilo kog unosa, počevši od videa. Model prihvata kombinacije teksta, slike, zvuka i videa, a zatim generiše visokokvalitetni video zasnovan na realnom znanju Gemini-ja. Takođe podržava konverzacijsko uređivanje videa, što će verovatno biti važnije od jednokratnog generisanja u stvarnim kreativnim tokovima posla.

Ta poslednja stavka je važna. Praktična vrednost kreativne veštačke inteligencije retko se svodi samo na „generisanje videa“. Produkcijski tokovi rada zahtevaju reviziju, zamenu, tajming, kontinuitet stila i razgovor o izmenama. Ako Omni može da učini uređivanje više konverzacijskim uz očuvanje konteksta, on postaje više od običnog generatora noviteta. Postaje kreativni interfejs.

// Gemini Omni treba posmatrati kao model kreativnog toka rada
input = { text: "Prikaži lansiranje proizvoda u kišnom sajberpank gradu", image: "brand-reference.png", audio: "voiceover.wav", video: "rough-cut.mp4"
} output = GeminiOmni.generateVideo(input)
revision = GeminiOmni.edit(output, "Učini osvetljenje toplijim i zadrži isti dizajn proizvoda")

Za timove koji grade medijske alate, vizuelne prikaze proizvoda za e-trgovinu, obrazovni sadržaj, prototipove igara, tokove rada u oglašavanju ili kanale za društvene video snimke, ovo je deo I/O 2026 koji je najvažniji. Interfejs se pomera sa ručnog uređivanja vremenske linije ka multimodalnom uređivanju zasnovanom na nameri. To ne uklanja kreativnu procenu, ali menja mesto gde se troši kreativni rad.

Gemini 3.5 Flash: Napredna inteligencija sa delovanjem

Gemini 3.5 Flash je druga polovina priče o računarstvu. Google opisuje porodicu Gemini 3.5 kao spoj napredne inteligencije i delovanja, i pozicionira 3.5 Flash kao prvo izdanje u toj porodici. Naglasak je na agentima, kodiranju, složenim dugoročnim zadacima i praktičnoj primeni u stvarnom svetu. Taj rečnik nije slučajan. On direktno ukazuje na sisteme koji rade stvari, a ne samo na sisteme koji odgovaraju.

Za programere, „Flash“ je važan jer su agentski tokovi rada osetljivi na kašnjenje. Model koji je pametan ali spor može da posluži za istraživanje ili pažljivo pisanje. Mnogo ga je teže uklopiti u automatizaciju u terminalu, IDE petlje, višekoračno korišćenje alata, pozadinske agente i korisnička iskustva proizvoda koja zahtevaju trenutnu povratnu informaciju. Google očigledno pokušava da brzo napredno ponašanje učini podrazumevanim motorom za agentske tokove rada.

// Klasično korišćenje modela
answer = model.generate("Objasni ovu funkciju") // Agentsko korišćenje modela
plan = model.plan(task)
toolResult = tools.run(plan.nextStep)
verification = model.verify(toolResult) if verification.failed: rollback()
else: continueExecution()

Ta promena je razlog zašto Gemini 3.5 pripada istoj grupi kao i Antigravity. Antigravity-ju je potreban model koji može da planira, izvršava, verifikuje i nastavi da se kreće bez pretvaranja razvojnog okruženja u čekaonicu. Ovde računarske performanse postaju korisničko iskustvo programera.

Zašto brzina i akcija idu zajedno

Google-ovo uvodno izlaganje u vezi sa brzinom nije samo marketing. Agentski sistemi umnožavaju latenciju. Jedan odgovor zahteva jedan krug komunikacije sa modelom. Radni tok sa više agenata može imati mnogo koraka: planiranje, izbor alata, uređivanje koda, izvršavanje u terminalu, verifikaciju, popravku, rezimiranje i ljudski pregled. Ako je svaki korak spor, ceo sistem postaje neupotrebljiv.

  • Brz izlaz poboljšava interaktivne petlje kodiranja.
  • Niska latencija čini da agenti sa više koraka deluju manje krhko.
  • Visoka propusnost je važna kada agenti rade na pozadinskim zadacima održavanja.
  • Stabilno rezonovanje je važno jer su brže pogrešne akcije i dalje pogrešne akcije.
  • Verifikacija ostaje od suštinskog značaja jer sama brzina ne znači i poverenje.
Koristan agent nije model koji odgovara samo jednom. To je model koji može da nastavi da deluje, a da radni tok ne deluje kao red za čekanje.— Perspektiva agentskog izvršnog okruženja

Gemini Omni protiv Gemini 3.5: Različiti poslovi, isti stek

Najjasniji način da se razumeju najave o računarskim resursima sa I/O 2026 jeste da se razdvoje poslovi. Gemini Omni je multimodalni model za kreiranje i uređivanje. Gemini 3.5 Flash je model orijentisan na akciju za agente i kodiranje. Oni su komplementarni, a ne zamenljivi. Proizvodni tim bi mogao da koristi Omni za generisanje medija, a Gemini 3.5 Flash za orkestriranje radnog toka oko tih medija.

// Primer toka rada proizvoda
creativeAsset = GeminiOmni.generateVideo(brief) agentPlan = Gemini35Flash.plan({ task: "Publish launch campaign", asset: creativeAsset, channels: ["YouTube Shorts", "landing page", "email"]
}) Gemini35Flash.execute(agentPlan, tools)

To je šira arhitektura na koju Google ukazuje. Kreativni modeli generišu bogatije artefakte. Akcioni modeli koordiniraju zadatke oko tih artefakata. Proizvodne površine izlažu te mogućnosti korisnicima. Razvojni alati pružaju orkestraciju i verifikaciju. Površine uređaja čine asistenta dostupnim u više konteksta.

Šta ovo znači za programere

Programeri ne bi trebalo da posmatraju Gemini 3.5 Flash samo kao još jednu opciju modela. On menja oblik aplikacija koje se mogu izgraditi na vrhu Google-ovog steka. Ako model može da rukuje dužim sekvencama zadataka, pouzdano koristi alate i radi dovoljno brzo za stvarne tokove posla, tada se aplikacije mogu pomeriti sa izolovanih AI funkcija na procese posredovane modelom.

  • Kod-agenti mogu refaktorisati, testirati i verifikovati veće jedinice zadataka.
  • Proizvodni agenti mogu pomoći korisnicima da pređu sa namere na akciju unutar jednog toka.
  • Medijske aplikacije mogu kombinovati Omni generisanje sa Gemini 3.5 orkestracijom.
  • Funkcije pretrage i Workspace-a mogu preći sa odgovaranja na izvršavanje.
  • Mobilne i XR površine mogu koristiti Gemini kao sloj konteksta uživo umesto kao udaljenog asistenta u oblaku.

Opasnost leži u prekomernoj izgradnji pre nego što operativni model sazri. Programerima su i dalje potrebni verzisanje, evaluacija, logovanje, kontrola troškova, zamensko ponašanje (fallback) i ljudska potvrda za akcije visokog uticaja. Jači model ne uklanja potrebu za inženjerskom disciplinom. On povećava vrednost te discipline.

Šta ovo znači za proizvodne timove

Proizvodni timovi bi trebalo da tumače Gemini Omni i Gemini 3.5 kao signal da Google želi da AI postane sloj izvršavanja širom ekosistema. To stvara i priliku i rizik. Prilika je brži put od namere korisnika do gotovog rezultata. Rizik je u tome što ponašanje proizvoda postaje manje transparentno ako su odluke agenata skrivene iza doteranog interfejsa.

agenticProductChecklist = { userIntent: "clear", modelRole: "defined", tools: "permissioned", outputs: "reviewable", failures: "recoverable", costs: "measured", userControl: "explicit"
}

Ako proizvodni tim ne može da odgovori na to šta je modelu dozvoljeno da radi, kako se evaluira i kako korisnik može da se oporavi od loše akcije, integracija nije spremna za produkciju. Ovo posebno važi kada je Gemini povezan sa Search, Workspace, Shopping, Android platformama ili interfejsima nosivih uređaja.

Suočavanje sa realnošću: Benchmarci nisu proizvod

Rizik kod svakog lansiranja modela je opijenost benchmark-ovima. Bolje performanse su važne, ali produkciona vrednost zavisi od kvaliteta integracije. Model može biti brži i jači, a da i dalje podbaci u specifičnom procesu rada jer su promptovi slabi, politike alata labave, evaluacija površna ili nedostaju opcije za vraćanje na prethodno stanje.

  • Kreativnom modelu su potrebni doslednost, mogućnost uređivanja i kontrola izlaza.
  • Akcionom modelu su potrebni disciplina u korišćenju alata, verifikacija i bezbedni režimi otkazivanja.
  • Programerskom modelu je potrebno ponovljivo ponašanje unutar stvarnih repozitorijuma.
  • Proizvodnom modelu su potrebni poverenje korisnika i jasne granice kontrole.
  • Platformskom modelu su potrebni verziranje, monitoring i vidljivost troškova.
Lansirni model privlači pažnju. Operativni model odlučuje o tome da li će opstati u produkciji.— Inženjerska provera realnosti

Kako se ovo uklapa u Google I/O 2026 klaster

Ovaj članak pokriva sloj modela u klasteru. Glavno Google I/O 2026 čvorište objašnjava potpunu arhitektonsku promenu. Antigravity, AI Studio i Google DevTools objašnjavaju kako modeli ulaze u razvojne tokove rada. Android XR i pametne naočare objašnjavaju kako se ista inteligencija prenosi na nosive uređaje. Agentski proizvodi u pretrazi, Workspace-u i kupovini objašnjavaju šta se dešava kada ove mogućnosti stignu do potrošačkih i produktivnih proizvoda.

Srodni članci u ovom klasteru

Završna perspektiva

Gemini Omni i Gemini 3.5 definišu računarsku podelu iza Google I/O 2026. Omni je sloj za kreiranje: multimodalni unos, video izlaz, konverzacijsko uređivanje i generisanje utemeljeno u stvarnom svetu. Gemini 3.5 Flash je sloj za akciju: brza napredna inteligencija za agente, kodiranje i dugoročne zadatke. Zajedno, oni objašnjavaju zašto ostatak uvodnog izlaganja izgleda tako kako izgleda. Antigravity zahteva modele akcionog nivoa. Pretrazi i Workspace-u su potrebni agenti koji mogu da rasuđuju i izvršavaju. Android XR zahteva razumevanje konteksta uživo. Uvodno izlaganje nije samo priča o modelima, ali bez ovog računarskog sloja ostatak priče ne funkcioniše.

Related Articles

Развој портала: Скалабилна платформа за перформансе, вишејезичну подршку и проширивост

Развој портала: Скалабилна платформа за перформансе, вишејезичну подршку и проширивост

Gradi se moderan veb portal sa fokusom na skalabilnost, visoke performanse

Konvertujte MOV u MP4 Korišćenjem FFmpeg-a: Jednostavan vodič

Konvertujte MOV u MP4 Korišćenjem FFmpeg-a: Jednostavan vodič

Naučite kako da konvertujete MOV video zapise u MP4 koristeći FFmpeg sa pouzdanim komandama, grupnom obradom i optimizacijom kvaliteta za veb, striming i kompatibilnost između platformi.

Model-View-Controller (MVC): Strukturna okosnica modernih veb aplikacija

Model-View-Controller (MVC): Strukturna okosnica modernih veb aplikacija

Model-View-Controller, obično skraćeno kao MVC, ostaje jedan od najtrajnijih arhitektonskih obrazaca u razvoju softvera. On timovima pruža praktičan način da razdvoje poslovnu logiku, prezentaciju i interakciju korisnika kako bi aplikacije ostale lakše za izgradnju, proširenje, testiranje i održavanje. Ovaj članak objašnjava šta je MVC, zašto je i dalje važan, gde se uklapa u današnje veb stekove i kako se povezuje sa širom arhitekturom platforme, kvalitetom isporuke, strategijom migracije i operativnom zrelošću.

Optimizacija kvaliteta koda: Testiranje sa ESLint-om i Prettier-om

Optimizacija kvaliteta koda: Testiranje sa ESLint-om i Prettier-om

U modernom razvoju softvera, održavanje doslednog kvaliteta i stila koda je od suštinskog značaja. ESLint i Prettier nude moćnu kombinaciju za automatizaciju ovih ključnih aspekata, obezbeđujući da su kodne baze čiste, čitljive i da se pridržavaju definisanih standarda. Ovaj članak se bavi time kako se ovi alati besprekorno integrišu u tokove rada testiranja, poboljšavajući produktivnost programera i održivost projekta.

javascript-batchverarbeitung-oder-stapelverarbeitung-von-function

Tranzicija Ubuntu grafičkog steka: Padovi pri pokretanju sa hibridnim GPU-om, Rizici Waylanda i stabilne prakse primene

Tranzicija Ubuntu grafičkog steka: Padovi pri pokretanju sa hibridnim GPU-om, Rizici Waylanda i stabilne prakse primene

Nadogradnje Ubuntu desktopa mogu izazvati zaglavljivanje pri pokretanju, nedostajuće sesije prijave i nestabilno renderovanje—posebno na hibridnim Intel + NVIDIA sistemima. Ovaj članak objašnjava osnovnu tranziciju grafičkog steka, zašto dolazi do regresija i kako bezbedno implementirati Ubuntu koristeći LTS bazne linije i validirane strategije drajvera.

PostfixAdmin: Upravljanje na nivou preduzeća za Postfix mejl sisteme — Anno 2026

PostfixAdmin: Upravljanje na nivou preduzeća za Postfix mejl sisteme — Anno 2026

PostfixAdmin je bazno-centričan administrativni interfejs dizajniran za profesionalne Postfix mejl sisteme. Umesto skrivanja složenosti, on pruža preciznu kontrolu nad domenima, poštanskim sandučićima, aliasima i dozvolama pošiljaoca. Ovaj članak objašnjava zašto PostfixAdmin ostaje pouzdano korporativno rešenje u 2026. godini i kako se uklapa u moderne, bezbednosno orijentisane mejl infrastrukture.

tensorflow

tensorflow

building-visualsfm-on-ubuntu-17-10-with-nvidia-cuda-support

apache-ubuntu-17-10-install-certbot-lets-encrypt

PostgreSQL 14 Ubuntu Server 23.04

PostgreSQL 14 Ubuntu Server 23.04

Nadolazeći Linux trendovi u 2026: Oblikovanje budućnosti serverske infrastrukture

Nadolazeći Linux trendovi u 2026: Oblikovanje budućnosti serverske infrastrukture

Istražite ključne Linux trendove u 2026. godini, od dominacije Kubernetes-a i imutabilnih distribucija do AI integracije i eBPF bezbednosti.