OpenAI выпускает GPT-5.4 с улучшенными рассуждениями на фоне обостряющейся гонки ИИ-моделей

OpenAI представила GPT-5.4 — последнюю флагманскую модель с существенно улучшенными возможностями рассуждений и когнитивной плотности. Релиз следует за GPT-5.3 'Garlic' и усиливает конкуренцию с Claude Opus 4.6 и Gemini 3.1 Pro.

Ключевые выводы

GPT-5.4 от OpenAI усиливает способности к рассуждению и продолжает стратегию когнитивной плотности, начатую в GPT-5.3 'Garlic' с 6-кратным увеличением плотности знаний на байт. Релиз обостряет конкуренцию с Anthropic и Google.

OpenAI представила GPT-5.4 — последнюю итерацию своей флагманской языковой модели, продолжая бешеный темп развития, определяющий ИИ-индустрию в начале 2026 года. Новая модель появилась всего через несколько недель после выпуска GPT-5.3 под кодовым названием 'Garlic', которая представила новый подход Enhanced Pre-Training Efficiency, достигший шестикратного увеличения плотности знаний на байт обучающих данных.

GPT-5.4 фокусируется прежде всего на улучшенных способностях к рассуждению — умении разбивать сложные задачи, сохранять логическую последовательность в длинных цепочках мыслей и самостоятельно корректировать направление при обнаружении тупиков. Хотя OpenAI не раскрыла конкретные результаты бенчмарков, ранние тестировщики отмечают существенные улучшения в математических рассуждениях, точности генерации кода и задачах многоэтапного планирования.

Прорыв когнитивной плотности

Философский сдвиг за GPT-5.3 и 5.4 примечателен. Вместо наращивания количества параметров — стратегии, доминировавшей в разработке ИИ с 2020 по 2024 год — OpenAI теперь приоритезирует то, что называет 'когнитивной плотностью': извлечение большей производительности из каждого параметра. Это имеет практическое значение для стоимости развёртывания, скорости отклика и возможности запуска мощных моделей на граничных устройствах.

Переполненный рынок

GPT-5.4 выходит на всё более конкурентный рынок. Claude Opus 4.6 от Anthropic ввёл 'адаптивное мышление', Gemini 3.1 Pro от Google продвигает мультимодальность, а китайский MiniMax M2.5 стал доступной альтернативой, соперничающей с Claude. Конкуренция расширяется и за пределы облачных провайдеров: Qwen 3.5 от Alibaba нацелен на потребительское железо, а локальные решения вроде Ollama позволяют запускать мощные модели без облака.