Компания OpenAI выпустила GPT-5.4 и GPT-5.4 Pro спустя два дня после релиза версии 5.3 Instant.
GPT-5.4 Thinking and GPT-5.4 Pro are rolling out now in ChatGPT.
GPT-5.4 is also now available in the API and Codex.
GPT-5.4 brings our advances in reasoning, coding, and agentic workflows into one frontier model. pic.twitter.com/1hy6xXLAmJ
— OpenAI (@OpenAI) March 5, 2026
Стандартная версия GPT-5.4 доступна в веб-интерфейсе ChatGPT, через API и в инструменте Codex. Версию GPT-5.4 Thinking открыли для подписчиков Plus, Team и Pro.
Для пользователей тарифа Pro и корпоративных клиентов Enterprise предназначена GPT-5.4 Pro, которая также доступна через API.
Базовая стоимость использования составляет $2,5 за 1 млн входных токенов и $15 за 1 млн выходных. Расценки для версии Pro заметно выше: $30 и $180 за 1 млн токенов соответственно.
Производительность в рабочих задачах
GPT-5.4 выдает более стабильные и качественные результаты в реальных сценариях применения. В бенчмарке GDPval, оценивающем выполнение задач по 44 профессиям, версия достигла показателя в 83%. Это означает, что модель работает на уровне профильных специалистов или превосходит их. Для сравнения, результат GPT-5.2 составлял 70,9%.
Источник: OpenAI.
Особое внимание разработчики уделили работе с таблицами, презентациями и документами. В задачах уровня младшего аналитика инвестбанка GPT‑5.4 набрала 87,3% против 68,4% у GPT‑5.2.
Презентации от новой модели оценщики предпочитали в 68% случаев — за лучшую эстетику, разнообразие и эффективное использование генерации изображений.
Источник: OpenAI.
GPT‑5.4 также стала самой точной моделью OpenAI с точки зрения работы с фактами. При тестировании на промптах с заранее известными ошибками:
отдельные утверждения оказывались ложными на 33% реже;
полные ответы содержали ошибки на 18% реже по сравнению с GPT‑5.2.
Компьютерное зрение
Версия первой получила встроенные возможности компьютерного зрения и управления ПК. Модель способна использовать мышь и клавиатуру, ориентируясь на скриншоты, а также писать код для автоматизации через Playwright.
Поведение настраивается под конкретные сценарии с учетом допустимого уровня риска.
В бенчмарке OSWorld-Verified (управление рабочим столом) GPT‑5.4 успешно выполнила 75% заданий, обойдя предыдущую версию (47,3%) и человека (72,4%). Прогресс связан с улучшенным визуальным восприятием:
в тесте MMMU-Pro (понимание и логика) результат составил 81,2% против 79,5% у GPT-5.2;
в OmniDocBench (анализ документов) средний показатель ошибок снизился с 0,140 до 0,109.
Программирование
В кодинге модель сравнялась со специализированной GPT‑5.3‑Codex, но работает быстрее.
В Codex появился режим /fast, ускоряющий генерацию в полтора раза без потери качества. По результатам внутренних тестов GPT‑5.4 показала высокие результаты в сложных задачах фронтенд-разработки.
Также представлен экспериментальный навык Playwright (Interactive). Он позволяет модели визуально отлаживать веб- и Electron-приложения, тестируя собственный код прямо в процессе написания.
Инструменты
В GPT‑5.4 появилась функция поиска инструментов (Tool Search). Раньше системе приходилось заранее загружать в контекст описания всех доступных плагинов. Это добавляло тысячи лишних токенов к каждому запросу и увеличивало стоимость.
Теперь модель получает лишь базовый список и при необходимости самостоятельно находит и подгружает нужные параметры. В тестах на базе MCP Atlas такой подход снизил потребление токенов на 47% без потери точности.
Веб-поиск также стал производительнее: в бенчмарке BrowseComp показатели выросли на 17%, а версия Pro достигла рекордных 89,3%. GPT‑5.4 Thinking эффективнее собирает информацию из множества источников, лучше прорабатывает сложные запросы и выдает более структурированные ответы.
Управляемость и контекст
При работе со сложными запросами GPT‑5.4 Thinking в ChatGPT сначала демонстрирует пользователю план действий. Это позволяет на ходу скорректировать направление, не перезапуская генерацию и не делая лишних уточнений. Функция уже доступна на сайте и в Android-приложении, скоро появится на iOS.
Модель также лучше удерживает контекст в длинных диалогах и дольше обдумывает сложные задачи. Это помогает сохранять связность и релевантность ответов даже при работе с большими объемами информации.
Напомним, в начале марта пользователи бойкотировали ChatGPT на фоне сделки OpenAI с Пентагоном.