Google запускает Nano Banana 2: бесплатный ИИ-генератор изображений с консистентностью персонажей между сценами
Новая модель Google Nano Banana 2, построенная на Gemini 3.1 Flash Image, обеспечивает консистентность до пяти персонажей между сценами, интеграцию с поиском в реальном времени и масштабирование до 4K — бесплатно для всех пользователей Gemini, Search и Google Lens.
Ключевые выводы
Nano Banana 2 сочетает скорость Gemini 3.1 Flash Image с продвинутыми функциями: консистентность до пяти персонажей между сценами, интеграция с веб-поиском для контекстуальной точности и масштабирование до 4K. Модель бесплатна и доступна во всей продуктовой линейке Google, бросая прямой вызов Midjourney и DALL-E 3.
Google выпустил свою самую мощную бесплатную модель генерации изображений. Nano Banana 2, официально известная как Gemini 3.1 Flash Image, запущена 26 февраля 2026 года и предлагает набор функций, которые ранее были доступны только по платной подписке у конкурентов — Midjourney и DALL-E 3 от OpenAI. Модель умеет сохранять внешний вид персонажей между несколькими сценами, использовать данные из поиска в реальном времени для создания контекстно точных изображений и рендерить текст внутри картинок — давнее слабое место предшественников.
Название «Nano Banana» стало чем-то вроде внутренней шутки ИИ-подразделения Google. Оригинальная Nano Banana Pro, выпущенная в конце 2025 года, получила прозвище благодаря внутреннему тестированию, где способность модели генерировать фотореалистичные фрукты использовалась как эталон качества. Продолжение оптимизировано для скорости и массового использования.
Консистентность персонажей: функция, которая меняет всё
Главный прорыв Nano Banana 2 — способность сохранять единообразный внешний вид персонажей в разных сценах и обстановках. Пользователь может задать до пяти персонажей и генерировать изображения с ними в совершенно разных контекстах — на пляже, на деловом совещании, в фэнтези-сражении — сохраняя черты лица, пропорции тела, стиль одежды и характерные особенности.
Эта функция решает одну из самых неприятных проблем предыдущих ИИ-генераторов. Ранние модели обрабатывали каждый промпт независимо, означая, что одно и то же описание персонажа каждый раз давало визуально разные результаты. Для создателей раскадровок, детских книг, комиксов и бренд-маскотов эта непоследовательность была критической проблемой.
Техническая архитектура: скорость Flash при качестве Pro
| Функция | Nano Banana Pro | Nano Banana 2 (Flash Image) | DALL-E 3 | Midjourney v7 |
|---|---|---|---|---|
| Консистентность персонажей | До 3 | До 5 | Нет | Ограничено (2) |
| Рендер текста | Да | Да | Да | Ограничено |
| Макс. разрешение | 4K | 4K (масштабирование) | 1024×1792 | 2048×2048 |
| Интеграция с поиском | Нет | Да (реальное время) | Нет | Нет |
| Скорость генерации | ~15 сек | ~3-5 сек | ~10 сек | ~30 сек |
| Цена | $20/мес | Бесплатно | $20/мес | $10-30/мес |
Поиск в реальном времени: контекстно-зависимая генерация
Уникальный отличительный фактор Nano Banana 2 — интеграция с Google Search. При генерации модель может обращаться к живому вебу для понимания контекста, проверки визуальных деталей и включения актуальной информации. Попросите сгенерировать «современного мирового лидера на трибуне» — модель обратится к данным в реальном времени, а не будет полагаться на устаревшие обучающие данные.
Эта технология расширяется на практические приложения. Дизайнер, запрашивающий «чехол для телефона в стиле последнего Samsung Galaxy», получит изображение, основанное на реальных снимках продукта из веба. Последствия для визуализации e-commerce продуктов, архитектурного рендера и образовательного контента значительны.
Рендер текста и масштабирование: профессиональный вывод
Рендеринг текста был ахиллесовой пятой ИИ-генерации изображений с момента появления технологии. Нечитаемый текст на вывесках и книгах был верным признаком ИИ-происхождения. Nano Banana 2 решает эту проблему через специализированный пайплайн обработки текста, который точно рендерит слова и числа внутри генерируемых изображений.
Модель также предлагает масштабирование до 4K разрешения через специальный модуль суперразрешения, который добавляет когерентные детали вместо простой интерполяции пикселей, делая результат пригодным для печати и больших дисплеев.
Доступность и влияние на рынок
Nano Banana 2 развёртывается по всей продуктовой экосистеме Google: в приложении Gemini, Google Search, AI Mode, Google Lens и видеоредакторе Flow. Для разработчиков — доступна в AI Studio, Gemini API, Google Antigravity, Vertex AI и Gemini CLI.
Предлагая эти возможности бесплатно, Google бросает прямой вызов бизнес-моделям Midjourney, OpenAI и Adobe Firefly. Стратегия Google очевидна: генерация изображений повышает вовлечённость в ИИ-продукты, что усиливает экосистему Gemini. Это тот же сценарий, что Google использовал с Search, Gmail и Google Docs — мощный бесплатный уровень, формирующий огромную базу пользователей.
Для креативной индустрии Nano Banana 2 представляет собой и возможность, и дизрупцию. Для малого бизнеса, преподавателей и разработчиков, у которых ранее не было бюджета на профессиональный визуальный контент, модель демократизирует возможности, которые были дорогими или недоступными всего два года назад.