Google Gemini теперь создаёт музыку: Lyria 3 генерирует треки с вокалом, инструментами и обложками
Генеративный ИИ March 8, 2026 📍 Mountain View, United States News

Google Gemini теперь создаёт музыку: Lyria 3 генерирует треки с вокалом, инструментами и обложками

Новая функция создания музыки в Google Gemini на базе DeepMind Lyria 3 генерирует полноценные 30-секундные треки с вокалом, инструментами и автоматически созданными обложками из текстовых описаний — с цифровым водяным знаком SynthID.

Ключевые выводы

Google запустила Lyria 3 в Gemini — функцию создания полноценных музыкальных треков с вокалом, инструментами и обложками по текстовому запросу. Технология выходит за рамки простой генерации аудио, предлагая многодорожечное продюсирование.


Google запустила функцию создания музыки в рамках ИИ-платформы Gemini, позволяющую пользователям генерировать оригинальные музыкальные треки из текстовых описаний, изображений или видеоклипов. Функция работает на основе Lyria 3 от Google DeepMind — наиболее продвинутой модели генерации музыки компании — и создаёт полноценные 30-секундные треки с вокалом, инструментами и автоматически сгенерированным текстом песни.

Мультимодальная генерация музыки

Возможности создания музыки в Gemini выходят за рамки простой генерации «текст-в-аудио». Пользователи могут предоставить текстовое описание («энергичный электронный трек с женским вокалом»), загрузить изображение (ИИ интерпретирует настроение и создаёт соответствующую композицию) или отправить видеоклип (Gemini сочиняет фоновую музыку, соответствующую тональности и ритму визуального контента).

Система предлагает широкие возможности настройки: жанр, настроение, стиль, темп, тип вокала и инструментовка. Каждый сгенерированный трек сопровождается уникальной обложкой, созданной с помощью технологии Google Nano Banana, формируя полный пакет для публикации и распространения.

Технические характеристики

  • Качество звука: высококачественный выход 48 кГц
  • Длительность трека: 30 секунд за генерацию
  • Компоненты: вокал, инструменты, автоматически сгенерированный текст
  • Входные данные: текст, изображения или видеоклипы
  • Водяной знак: неразличимый SynthID для идентификации ИИ-контента
  • Обложка: автоматическая генерация через Nano Banana

Целостность контента и влияние на индустрию

Каждый трек, сгенерированный через Gemini, содержит SynthID — неразличимый цифровой водяной знак Google DeepMind, предназначенный для идентификации ИИ-сгенерированного контента. Водяной знак выдерживает стандартные аудиотрансформации и позволяет автоматически определять ИИ-созданную музыку, отвечая на ключевую обеспокоенность музыкальной индустрии — способность отличить её от произведений, созданных людьми.

Функция ставит Google в ряд конкурентов — Suno и Udio — на стремительно расширяющемся рынке ИИ-генерации музыки. Однако интеграция в платформу Gemini, обслуживающую сотни миллионов пользователей, обеспечивает функции немедленный масштаб, недоступный автономным музыкальным ИИ-стартапам. Для профессиональных создателей Google разрабатывает отдельные инструменты — Music AI Sandbox и MusicFX DJ — с расширенным контролем и возможностью генерации более длинной или непрерывной музыки.

Музыкальная индустрия пристально наблюдает. ИИ-генерированная музыка создаёт новые творческие возможности для создателей контента, рекламодателей и обычных пользователей, но одновременно поднимает фундаментальные вопросы об авторском праве, роялти и экономическом влиянии на профессиональных музыкантов. Ответы на эти вопросы определят отношения между ИИ и творческими индустриями на годы вперёд.

Share X Reddit LinkedIn Telegram Facebook