Evo2: ИИ-модель, обученная на триллионах букв ДНК, которая может проектировать новые формы жизни
Учёные представили Evo2 — фундаментальную модель на 40 млрд параметров, обученную на 9,3 трлн нуклеотидных токенов из 2,7 млн геномов. Модель анализирует и генерирует полные геномные последовательности, открывая беспрецедентные возможности синтетической биологии.
Ключевые выводы
Evo2 — геномная фундаментальная модель на 40 млрд параметров, обученная на 9,3 трлн ДНК-токенов. Она предсказывает функции генов, выявляет патогенные мутации и генерирует синтетические геномные последовательности, потенциально революционизируя медицину и биотехнологии.
В одном из самых амбициозных применений архитектуры трансформеров к биологии группа исследователей представила Evo2 — фундаментальную модель на 40 миллиардов параметров, обученную на 9,3 триллиона нуклеотидных токенов из примерно 2,7 миллиона геномов всех доменов жизни. Модель не просто читает ДНК — она понимает её достаточно глубоко, чтобы генерировать совершенно новые геномные последовательности.
От языковых моделей к моделям жизни
Архитектурные параллели с большими языковыми моделями поразительны. Подобно тому, как GPT учится предсказывать следующее слово, Evo2 учится предсказывать следующий нуклеотид в ДНК-последовательности. Но последствия несравнимо глубже: понимая статистическую структуру геномов, отточенных миллиардами лет эволюции, модель может выявлять вредные мутации, предсказывать функции генов и проектировать синтетическую ДНК с заданными свойствами.
Практические применения
- Разработка лекарств: предсказание влияния генетических вариантов на риск заболеваний и ответ на лечение
- Синтетическая биология: проектирование новых ферментов, метаболических путей и минимальных геномов
- Сельское хозяйство: создание сортов с улучшенной урожайностью, засухоустойчивостью и питательными характеристиками
- Диагностика: выявление патогенных мутаций в клинических данных секвенирования
Способность генерировать полные геномные последовательности поднимает серьёзные вопросы биобезопасности. Команда внедрила контроль доступа и ограничения на генерацию последовательностей известных патогенов. Тем не менее, Evo2 — переломный момент: первый случай, когда ИИ-модель демонстрирует способность 'говорить на языке ДНК' на уровне, способном реально ускорить и понимание жизни, и инженерию жизни.