IBM представляет прорывной аналоговый ИИ-чип для энергоэффективного глубокого обучения
IBM Research демонстрирует новый аналоговый ИИ-процессор, выполняющий вычисления нейросетей непосредственно в памяти и достигающий драматической экономии энергии по сравнению с цифровой GPU-архитектурой.
Ключевые выводы
IBM представила аналоговый ИИ-чип, выполняющий нейросетевые вычисления прямо в памяти — без перемещения данных между процессором и хранилищем. Это устраняет главное узкое место традиционных GPU и может радикально снизить энергопотребление ИИ-систем.
IBM Research представила прорывной аналоговый ИИ-чип, выполняющий нейросетевые вычисления непосредственно внутри ячеек памяти — радикальный отход от традиционных цифровых архитектур. Подход «вычислений в памяти» устраняет главное «бутылочное горлышко» современных ИИ-процессоров: необходимость постоянного перемещения данных между вычислительными блоками и памятью.
Вычисления в памяти: смена парадигмы
Традиционные цифровые ИИ-процессоры — GPU от Nvidia и TPU от Google — работают по принципу перемещения данных между вычислительными ядрами и оперативной памятью. Этот «стена памяти» потребляет значительную часть энергии и ограничивает скорость обработки. ИИ-чип IBM использует матрицы на основе энергонезависимой памяти (NVM crossbar), хранящие веса нейросетей непосредственно в ячейках.
Когда входные сигналы подаются на crossbar-матрицу, математические операции, необходимые для инференса нейросетей — умножение матриц и накопление — выполняются мгновенно через физические свойства самих ячеек памяти, без передачи данных. Это обеспечивает порядки величины экономии энергии.
Значение для ИИ-индустрии
Энергопотребление ИИ-дата-центров стало критической проблемой индустрии. Общее потребление дата-центрами электроэнергии стремительно растёт, а ИИ-рабочие нагрузки являются основным драйвером этого роста. Технологии, способные драматически снизить энергопотребление ИИ-инференса, имеют стратегическое значение.
Аналоговый подход IBM особенно перспективен именно для инференса — процесса запуска обученных моделей в производственной среде, составляющего подавляющую долю ИИ-вычислений в коммерческих развёртываниях.
Сравнение с существующим ИИ-оборудованием
| Платформа | Архитектура | Преимущества | Ограничения |
|---|---|---|---|
| Nvidia GPU (цифровая) | Массивно-параллельные цифровые вычисления | Универсальность обучения + инференса | Высокое энергопотребление, «стена памяти» |
| Google TPU (цифровая) | Специализированный цифровой ускоритель | Оптимизация для тензорных операций | Меньшая гибкость, чем у GPU |
| IBM аналоговый ИИ | Вычисления в памяти через NVM crossbar | Драматическая энергоэффективность | На стадии исследований, ограничения точности |
Аналоговый чип IBM пока находится на стадии исследований и не доступен коммерчески. Однако демонстрация предоставляет убедительное доказательство того, что парадигма «вычислений в памяти» может стать жизнеспособной альтернативой энергоёмкой цифровой ИИ-инфраструктуре текущего поколения.