Google Gemini теперь создаёт музыку: Lyria 3 генерирует треки с вокалом, инструментами и обложками
Новая функция создания музыки в Google Gemini на базе DeepMind Lyria 3 генерирует полноценные 30-секундные треки с вокалом, инструментами и автоматически созданными обложками из текстовых описаний — с цифровым водяным знаком SynthID.
Ключевые выводы
Google запустила Lyria 3 в Gemini — функцию создания полноценных музыкальных треков с вокалом, инструментами и обложками по текстовому запросу. Технология выходит за рамки простой генерации аудио, предлагая многодорожечное продюсирование.
Google запустила функцию создания музыки в рамках ИИ-платформы Gemini, позволяющую пользователям генерировать оригинальные музыкальные треки из текстовых описаний, изображений или видеоклипов. Функция работает на основе Lyria 3 от Google DeepMind — наиболее продвинутой модели генерации музыки компании — и создаёт полноценные 30-секундные треки с вокалом, инструментами и автоматически сгенерированным текстом песни.
Мультимодальная генерация музыки
Возможности создания музыки в Gemini выходят за рамки простой генерации «текст-в-аудио». Пользователи могут предоставить текстовое описание («энергичный электронный трек с женским вокалом»), загрузить изображение (ИИ интерпретирует настроение и создаёт соответствующую композицию) или отправить видеоклип (Gemini сочиняет фоновую музыку, соответствующую тональности и ритму визуального контента).
Система предлагает широкие возможности настройки: жанр, настроение, стиль, темп, тип вокала и инструментовка. Каждый сгенерированный трек сопровождается уникальной обложкой, созданной с помощью технологии Google Nano Banana, формируя полный пакет для публикации и распространения.
Технические характеристики
- Качество звука: высококачественный выход 48 кГц
- Длительность трека: 30 секунд за генерацию
- Компоненты: вокал, инструменты, автоматически сгенерированный текст
- Входные данные: текст, изображения или видеоклипы
- Водяной знак: неразличимый SynthID для идентификации ИИ-контента
- Обложка: автоматическая генерация через Nano Banana
Целостность контента и влияние на индустрию
Каждый трек, сгенерированный через Gemini, содержит SynthID — неразличимый цифровой водяной знак Google DeepMind, предназначенный для идентификации ИИ-сгенерированного контента. Водяной знак выдерживает стандартные аудиотрансформации и позволяет автоматически определять ИИ-созданную музыку, отвечая на ключевую обеспокоенность музыкальной индустрии — способность отличить её от произведений, созданных людьми.
Функция ставит Google в ряд конкурентов — Suno и Udio — на стремительно расширяющемся рынке ИИ-генерации музыки. Однако интеграция в платформу Gemini, обслуживающую сотни миллионов пользователей, обеспечивает функции немедленный масштаб, недоступный автономным музыкальным ИИ-стартапам. Для профессиональных создателей Google разрабатывает отдельные инструменты — Music AI Sandbox и MusicFX DJ — с расширенным контролем и возможностью генерации более длинной или непрерывной музыки.
Музыкальная индустрия пристально наблюдает. ИИ-генерированная музыка создаёт новые творческие возможности для создателей контента, рекламодателей и обычных пользователей, но одновременно поднимает фундаментальные вопросы об авторском праве, роялти и экономическом влиянии на профессиональных музыкантов. Ответы на эти вопросы определят отношения между ИИ и творческими индустриями на годы вперёд.