Evo2: ИИ-модель, обученная на триллионах букв ДНК, которая может проектировать новые формы жизни
Наука и открытия March 9, 2026 📍 San Francisco, United States Research Review

Evo2: ИИ-модель, обученная на триллионах букв ДНК, которая может проектировать новые формы жизни

Учёные представили Evo2 — фундаментальную модель на 40 млрд параметров, обученную на 9,3 трлн нуклеотидных токенов из 2,7 млн геномов. Модель анализирует и генерирует полные геномные последовательности, открывая беспрецедентные возможности синтетической биологии.

Ключевые выводы

Evo2 — геномная фундаментальная модель на 40 млрд параметров, обученная на 9,3 трлн ДНК-токенов. Она предсказывает функции генов, выявляет патогенные мутации и генерирует синтетические геномные последовательности, потенциально революционизируя медицину и биотехнологии.


В одном из самых амбициозных применений архитектуры трансформеров к биологии группа исследователей представила Evo2 — фундаментальную модель на 40 миллиардов параметров, обученную на 9,3 триллиона нуклеотидных токенов из примерно 2,7 миллиона геномов всех доменов жизни. Модель не просто читает ДНК — она понимает её достаточно глубоко, чтобы генерировать совершенно новые геномные последовательности.

От языковых моделей к моделям жизни

Архитектурные параллели с большими языковыми моделями поразительны. Подобно тому, как GPT учится предсказывать следующее слово, Evo2 учится предсказывать следующий нуклеотид в ДНК-последовательности. Но последствия несравнимо глубже: понимая статистическую структуру геномов, отточенных миллиардами лет эволюции, модель может выявлять вредные мутации, предсказывать функции генов и проектировать синтетическую ДНК с заданными свойствами.

Практические применения

  • Разработка лекарств: предсказание влияния генетических вариантов на риск заболеваний и ответ на лечение
  • Синтетическая биология: проектирование новых ферментов, метаболических путей и минимальных геномов
  • Сельское хозяйство: создание сортов с улучшенной урожайностью, засухоустойчивостью и питательными характеристиками
  • Диагностика: выявление патогенных мутаций в клинических данных секвенирования

Способность генерировать полные геномные последовательности поднимает серьёзные вопросы биобезопасности. Команда внедрила контроль доступа и ограничения на генерацию последовательностей известных патогенов. Тем не менее, Evo2 — переломный момент: первый случай, когда ИИ-модель демонстрирует способность 'говорить на языке ДНК' на уровне, способном реально ускорить и понимание жизни, и инженерию жизни.

Share X Reddit LinkedIn Telegram Facebook