OpenAI добавляет три голосовые модели в свой API

7 мая 2026 года OpenAI добавила в API три голосовые модели реального времени. Событие примечательно не тем, что у OpenAI теперь появились голосовые возможности — они существуют уже давно, — а тем, что новые модели умеют делать в рамках разговора.

Три новых инструмента: GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper.

GPT-Realtime-2 описывается как работающая на «рассуждениях уровня GPT-5», что помещает её значительно выше прежних голосовых моделей в обработке сложных запросов в ходе диалога. OpenAI заявляет, что цель — перевести голосовое взаимодействие в реальном времени «от простого формата вопрос-ответ к голосовым интерфейсам, способным реально выполнять работу», — то есть голосовой слой становится способным к тому виду рассуждений, который прежде был доступен только в текстовых взаимодействиях.

GPT-Realtime-Translate обеспечивает синхронный перевод с поддержкой более 70 входных языков и 13 выходных.

GPT-Realtime-Whisper предоставляет живую транскрипцию речи в текст.

Модели тарифицируются по-разному: GPT-Realtime-2 — по токенам, а модели перевода и транскрипции — по минутам. Это разграничение имеет практическое значение для продуктового планирования: голосовой ассистент, обрабатывающий сложные запросы, будет иметь принципиально иную юнит-экономику, чем сервис транскрипции, работающий с большим объёмом коротких звонков.

Для продакт-менеджеров ключевой сигнал — это то, что голосовой продукт, для которого прежде требовались значительные инженерные усилия для достижения «качества ассистента», теперь имеет более доступный путь через API. Сочетание голосового рассуждения высокого уровня и живой транскрипции открывает сценарии использования в образовании, клиентской поддержке и прямых трансляциях, где взаимодействие не сводится к простой паре вопрос-ответ.

OpenAI встроила автоматический мониторинг разговоров для выявления нарушений политики — это актуально для команд, работающих в регулируемых отраслях или создающих продукты для потребителей, где риск злоупотреблений является продуктовым соображением.