Gemini Omni와 Gemini 3.5 Flash: Google I/O 2026, 영상 생성과 에이전트의 두 갈래
한줄평
Google이 영상 생성(Omni)과 에이전트(3.5 Flash) 두 갈래로 나눠 갑니다. 데모 품질은 실사용으로 검증해봐야겠지만, 코딩 관점에선 Antigravity 하니스를 쓰는 3.5 Flash가 더 주목할 만해요.
안녕하세요, Tom입니다.
지난 5월에 Gemini 3.5를 한 번 다룬 적이 있는데, Google I/O 2026에서 이야기가 더 구체화됐어요. 이번엔 Gemini Omni라는 새 모델까지 같이 공개되면서, Google이 두 갈래로 움직이고 있다는 게 분명해졌어요. 하나는 영상 생성, 하나는 에이전트. 9개의 데모 영상으로 공개된 내용을 정리해봤어요.
Gemini Omni: 무엇이든 영상으로
Gemini Omni는 Google의 새 영상 생성 모델이에요. 슬로건이 인상적이에요. "어떤 입력으로든 무엇이든 만들 수 있다, 영상부터 시작해서."
이미지, 오디오, 비디오, 텍스트를 입력으로 받아서 고품질 영상을 만들어내는데, 핵심은 일관성이에요. 캐릭터, 물리 법칙, 장면 연속성을 유지하면서 영상을 생성해요. 영상 생성 모델에서 가장 어려운 부분이 바로 이 일관성이거든요. 프레임마다 캐릭터 얼굴이 미묘하게 바뀌거나 물리적으로 말이 안 되는 동작이 나오면 금방 티가 나니까요.
데모에서 보여준 능력들이 흥미로워요.
대화로 영상 편집장면을 자연어로 수정해요. 예를 들어 조각상을 거품으로 바꾸는 식인데, 그러면서도 물리적 일관성을 유지해요.
액션 재구성영상 속에서 벌어지는 일을 바꾸거나, 캐릭터를 추가하거나, 순간을 통째로 변형해요.
반복적 다듬기이전 수정 위에 계속 편집을 쌓아 올려요. 바이올리니스트 데모가 대표적인데, 환경을 옮기고, 바이올린을 투명하게 만들고, 카메라 앵글을 조정하는 식으로 단계를 거듭하며 다듬어가요.
대화하듯 영상을 고쳐나가면서도 장면의 일관성이 유지된다는 게 Gemini Omni의 차별점이에요.
Gemini 3.5 Flash: 에이전트와 코딩
Gemini 3.5는 Google이 "더 유능하고 똑똑한 에이전트를 만드는 데 있어 큰 도약"이라고 표현한 모델이에요. 그 첫 릴리스가 3.5 Flash인데, 성능과 속도의 균형을 맞추면서 복잡하고 긴 호흡의 작업에 강점을 보여요.
데모에서 보여준 능력들이에요.
에이전트 작업 실행Antigravity라는 하니스를 써서 멀티스텝 워크플로우를 처리해요. 자산을 자동으로 분류하는 식의 작업을 보여줬어요.
풍부한 UI 생성체크아웃 플로우 같은 인터페이스에 대해 서로 다른 UX 접근을 몇 초 만에 만들어내요.
개인 AI 에이전트Gemini 앱 기능과 새로운 검색 정보 에이전트를 구동해요.
맞춤형 경험피트니스 트래커, 대시보드, 작은 미니 앱을 그때그때 만들어내요.
Search, Gmail 연동, Workspace 도구 등 여러 플랫폼에 걸쳐 에이전트 능력과 코딩에 무게를 둔 모델이에요.
두 모델, 두 방향
이번 발표에서 흥미로운 건 Google이 한 모델로 다 하려 하지 않는다는 점이에요. Gemini Omni는 창의적 멀티모달 생성, Gemini 3.5 Flash는 지능적 작업 자동화. 서로 다른 강점을 가진 두 갈래로 나눠 가는 거예요.
개인적으로는 3.5 Flash 쪽이 더 눈에 들어와요. Antigravity 하니스로 멀티스텝 작업을 처리하고 몇 초 만에 UI를 뽑아낸다는 부분은, 요즘 코딩 에이전트 경쟁 구도에서 Google이 어디를 노리는지 잘 보여주거든요. Claude Code나 Codex와 같은 링에 올라온 셈이에요.
Gemini Omni는 솔직히 데모만으로는 실제 품질을 판단하기 어려워요. 영상 생성 모델은 데모와 실사용의 간극이 큰 분야라서요. 다만 대화로 영상을 편집하면서 일관성을 유지한다는 방향성 자체는 분명히 매력적이에요.
I/O 2026의 다른 발표들도 정리되는 대로 다뤄볼게요. Google이 이번에 꽤 많은 카드를 한꺼번에 꺼냈거든요.
Claude Code, OpenCode 같은 AI 코딩 도구를 직접 쓰면서 AI 업계의 변화를 개발자 관점에서 기록합니다. 단순 번역이 아니라 써본 경험과 해석을 함께 남기려고 해요.
관련 글
Gemini가 추천한 사이트에서 해킹당했다: AI 추천의 보안 사각지대
AI가 추천한 사이트에서 '로봇 아님' 인증을 하다가 악성 스크립트에 감염된 사례입니다. curl|bash 공격 체인이 정교하더라고요.
Gemini 3.1 Flash TTS: AI 음성 생성의 감독석에 앉다
Google이 텍스트-음성 변환 모델 Gemini 3.1 Flash TTS를 공개했어요. 오디오 태그로 음색, 속도, 감정까지 세밀하게 조절할 수 있고, 70개 이상 언어를 지원해요.
Gemini in Sheets, SOTA 달성: 스프레드시트의 AI 시대
Google이 Gemini in Sheets의 SpreadsheetBench 벤치마크에서 70.48%로 SOTA를 달성했습니다. 인간 전문가 수준에 근접한 스프레드시트 AI의 현재.