Google Lyria 3: AI 음악 생성이 드디어 개발자에게 열렸어요
안녕하세요, Tom입니다.
Google이 Lyria 3 음악 생성 모델을 개발자에게 공개했어요. Gemini API와 Google AI Studio에서 바로 써볼 수 있는데, 이번에는 단순히 "음악을 만들어 줘"가 아니라 섹션별로 작곡하고, 템포를 지정하고, 가사 타이밍까지 제어할 수 있는 수준이에요.
AI 음악 생성이 장난감 수준에서 실무 도구로 넘어가는 느낌이 강하게 들더라고요.
두 가지 모델
Lyria 3는 용도에 따라 두 가지 버전으로 나뉘어요.
| 모델 | ID | 길이 | 용도 |
|---|---|---|---|
| Lyria 3 Pro | lyria-3-pro-preview | ~3분 풀 트랙 | 스튜디오급 완성곡 |
| Lyria 3 Clip | lyria-3-clip-preview | 30초 클립 | 빠른 프로토타이핑, 소셜 미디어, BGM |
Pro는 퀄리티, Clip은 속도. 아이디어를 빠르게 검증할 때는 Clip으로, 실제 서비스에 넣을 트랙은 Pro로 쓰면 돼요.
뭐가 특별한가
섹션별 작곡 (Composer 모드)
AI Studio에서 제공되는 Composer 모드가 인상적이에요. 인트로, 벌스, 브릿지 같은 곡 구조를 섹션별로 설계할 수 있어요. 각 섹션마다 타이밍, 강도, 설명을 따로 지정할 수 있고요.
"자연어로 음악 제작"이라는 게 이런 느낌이구나 싶더라고요.
템포 & 가사 타이밍 제어
특정 BPM을 지정하면 높은 정확도로 반영되고, 가사가 트랙 내에서 언제 시작하고 끝나는지도 제어할 수 있어요. 영상에 음악을 맞추거나, 특정 장면에 가사가 들어가야 할 때 유용할 것 같아요.
이미지로 분위기 전달
텍스트뿐만 아니라 이미지를 입력으로 넣으면 분위기, 스타일, 감정을 반영한 음악을 생성해요. 멀티모달 입력이 음악에까지 확장된 거예요.
다국어 보컬 & 다양한 장르
팝, 펑크, 모타운 등 다양한 장르를 지원하고, 보컬도 여러 언어로 생성할 수 있어요. 표현력 있는 뉘앙스와 선명한 음질을 갖춘 리얼리스틱한 보컬이라고 하는데, 직접 들어봐야 판단할 수 있겠지만 데모는 꽤 괜찮았어요.
이런 걸 만들 수 있어요
Google이 보여준 데모 앱 두 가지가 흥미로워요.
- 영상 BGM 자동 생성 — 영상을 업로드하면 Gemini 3 Flash가 분석하고, Lyria 3가 분위기에 맞는 사운드트랙을 작곡
- AI 알람 시계 — 매일 아침 날씨, 위치, 일정을 반영한 새로운 곡을 생성해서 알람으로 재생
두 번째 건 좀 과하다 싶지만, 첫 번째는 콘텐츠 제작자에게 정말 실용적인 유스 케이스예요.
안전성
모든 생성 트랙에 SynthID 디지털 워터마크가 포함돼요. AI가 만든 음악인지 검증할 수 있는 장치인데, 저작권 이슈가 민감한 음악 분야에서 이런 투명성 장치는 필수적이에요.
총평
Lyria 3는 AI 음악 생성이 "재미있는 실험"에서 "개발자가 서비스에 통합할 수 있는 도구"로 넘어가는 분기점 같은 느낌이에요. Gemini API로 바로 접근할 수 있다는 점에서 진입 장벽도 낮고요.
음악 관련 서비스를 만들고 있거나, 콘텐츠에 BGM이 필요한 분들이라면 Google AI Studio에서 한 번 시험해보세요.
관련 글
Gemini가 추천한 사이트에서 해킹당했다: AI 추천의 보안 사각지대
AI가 추천한 사이트에서 '로봇 아님' 인증을 하다가 악성 스크립트에 감염된 사례입니다. curl|bash 공격 체인이 정교하더라고요.
Gemini 3.1 Flash TTS: AI 음성 생성의 감독석에 앉다
Google이 텍스트-음성 변환 모델 Gemini 3.1 Flash TTS를 공개했어요. 오디오 태그로 음색, 속도, 감정까지 세밀하게 조절할 수 있고, 70개 이상 언어를 지원해요.
Gemini 3.1 Flash Live: 음성 AI의 새로운 기준이 될까?
Google이 실시간 음성 대화에 최적화된 Gemini 3.1 Flash Live를 공개했어요. 200개국 이상에서 Search Live로 바로 만나볼 수 있고, 개발자 프리뷰도 열렸어요.