Gemini Omni와 Gemini 3.5 Flash: Google I/O 2026, 영상 생성과 에이전트의 두 갈래
Google I/O 2026에서 Gemini Omni와 Gemini 3.5 Flash가 공개됐어요. 하나는 어떤 입력이든 영상으로 만들어내는 모델, 하나는 에이전트와 코딩에 초점을 맞춘 모델이에요. 9개 데모로 본 두 모델의 방향을 정리했어요.
Entity
Google의 AI 모델 시리즈. 블로그에서는 Gemini 3, Gemini 3.1 계열의 출시와 벤치마크 성과, Gemini API를 활용한 개발자 도구, 그리고 Google 제품(Search, Sheets, Lyria)과의 통합 사례를 다루고 있다.
Google I/O 2026에서 Gemini Omni와 Gemini 3.5 Flash가 공개됐어요. 하나는 어떤 입력이든 영상으로 만들어내는 모델, 하나는 에이전트와 코딩에 초점을 맞춘 모델이에요. 9개 데모로 본 두 모델의 방향을 정리했어요.
Google I/O 2026에서 Gemini 3.5가 공개됐어요. 'action'이라는 키워드가 인상적인데, 단순 대화가 아니라 장기 에이전트 작업을 빠르게 굴리는 데 최적화된 모델이에요.
AI가 추천한 사이트에서 '로봇 아님' 인증을 하다가 악성 스크립트에 감염된 사례입니다. curl|bash 공격 체인이 정교하더라고요.
Google이 텍스트-음성 변환 모델 Gemini 3.1 Flash TTS를 공개했어요. 오디오 태그로 음색, 속도, 감정까지 세밀하게 조절할 수 있고, 70개 이상 언어를 지원해요.
Google이 실시간 음성 대화에 최적화된 Gemini 3.1 Flash Live를 공개했어요. 200개국 이상에서 Search Live로 바로 만나볼 수 있고, 개발자 프리뷰도 열렸어요.
Google이 Lyria 3 음악 생성 모델을 Gemini API로 공개했어요. 3분짜리 풀 트랙부터 30초 클립까지, 개발자가 직접 음악 AI를 써볼 수 있게 됐어요.
Google이 Gemini in Sheets의 SpreadsheetBench 벤치마크에서 70.48%로 SOTA를 달성했습니다. 인간 전문가 수준에 근접한 스프레드시트 AI의 현재.
입력 $0.25/1M 토큰, 출력 $1.50/1M 토큰. 2.5 Flash보다 2.5배 빠른 TTFT, 45% 빠른 출력 속도. 대규모 워크로드를 위한 Google의 새 AI 모델.
Gemini 2.0 Pro, Gemini Flash, Gemma, AI Studio, Vertex AI — Google의 AI 생태계가 복잡해졌어요. 개발자 관점에서 뭘 써야 하는지 정리했습니다.
GPT-5.2, Claude Sonnet 4.6, Gemini 2.0 Pro — 2026년 초 주요 AI 모델들을 코딩, 분석, 창작 등 실제 사용 관점에서 비교했어요.
Google DeepMind의 Lyria 3가 Gemini 앱에 탑재됐어요. 텍스트나 사진만으로 30초 고품질 음악을 만들 수 있습니다.
Google이 Gemini 3 Deep Think를 대폭 업그레이드했어요. 수학 올림피아드 금메달, ARC-AGI-2 84.6%, Codeforces Elo 3455 등 인상적인 수치입니다.
Google AI Plus가 미국을 포함한 35개 신규 국가에 출시. 월 $7.99에 Gemini 3 Pro, Nano Banana Pro, Flow AI 영상 도구, NotebookLM 등 제공.
Google Search가 Gemini 3를 AI Overviews 기본 모델로 채택. AI Overview에서 바로 후속 질문을 하며 대화형 검색이 가능해졌다.
Google DeepMind의 가장 인기 있는 이미지 생성 모델 Nano Banana의 재미있는 이름 탄생 비화를 소개합니다. 새벽 2시 30분의 급한 결정이 바이럴 성공으로 이어진 이야기입니다.