OpenAI представила GPT‑Realtime‑2: модель с пятью уровнями рассуждений и контекстом на 128 тыс. токенов

Компания OpenAI представила новую модель GPT‑Realtime‑2, которая поддерживает пять уровней рассуждений, контекстное окно на 128 тыс. токенов и адаптивный тон общения. Модель может использовать сторонние инструменты, реагировать на уточнения и отображать прогресс выполнения запрос.
- OpenAI выпустила модель GPT‑Realtime‑2 с пятью уровнями рассуждений: от минимального до очень высокого, по умолчанию установлен низкий уровень.
- Контекстное окно увеличено с 32 тыс. до 128 тыс. токенов, максимальное количество токенов в ответе — 32 тыс.
- Модель поддерживает сторонние инструменты, реагирует на перебивания и уточнения, а также может использовать разговорные «филлеры» при обращении к инструментам или в случае сбоев.
- GPT‑Realtime‑2 адаптирует тон общения под ситуацию: спокойный при проблемах, эмпатичный при замешательстве и задорный при успешном выполнении задачи.
- Разработчики могут настраивать уровень рассуждений, добавлять разговорные фразы и выбирать, как модель будет информировать о прогрессе выполнения запроса.
Компания OpenAI представила новую модель GPT‑Realtime‑2, которая выводит взаимодействие с ИИ на новый уровень. Теперь модель поддерживает пять уровней «рассуждений» — от минимального до очень высокого, причем по умолчанию установлен низкий.
Это позволяет пользователям выбирать, насколько глубоким должен быть анализ запроса перед формированием ответа. Значительно расширено контекстное окно: с 32 тыс. до 128 тыс. токенов. Максимальное количество токенов в одном ответе ограничено 32 тыс., что позволяет обрабатывать большие объемы данных без потери связности. Модель лучше удерживает узкую терминологию и имена собственные, а также может подстраивать свой тон под характер беседы.
Если у пользователя проблема, ИИ отвечает спокойно, при замешательстве — эмпатично, а после успешного выполнения задачи — задорно.
Новая модель поддерживает сторонние инструменты и реагирует на перебивания и уточнения в реальном времени. Разработчики могут включать разговорные «филлеры», которые модель произносит перед основным ответом или при обращении к инструментам. Например, «дай-ка проверю», «минутку, изучу вопрос», «проверяю календарь» или «как раз открыл...».
В случае сбоев модель не отключается, а информирует пользователя о проблеме, сохраняя диалог. GPT‑Realtime‑2 демонстрирует улучшенную способность удерживать контекст на протяжении длинных диалогов.
Это особенно важно для корпоративных чат-ботов, образовательных платформ и сложных аналитических задач. OpenAI открывает доступ к модели разработчикам, которые могут настраивать уровень рассуждений, добавлять разговорные фразы и выбирать, как модель будет информировать о прогрессе выполнения запроса.
Новая модель GPT‑Realtime‑2 от OpenAI — это не просто эволюция, а революция в том, как мы взаимодействуем с ИИ. Разработчики наконец-то сделали шаг к созданию по-настоящему «живого» диалога, где модель не только отвечает, но и «чувствует» контекст, адаптируется к тону собеседника и даже может «задумываться» перед ответом. Особенно впечатляет поддержка сторонних инструментов и возможность настройки разговорных «филлеров» — это делает взаимодействие с ИИ более естественным и предсказуемым. Однако ключевым вызовом станет баланс между глубиной рассуждений и скоростью ответа. Если OpenAI удастся сохранить производительность на фоне увеличенного контекста, GPT‑Realtime‑2 может стать стандартом для
Владимир Платонов