Skip to content
Новость TechCrunch апр. 2026 г.

TechCrunch: Microsoft AI выпускает три базовых модели для текста, голоса и изображений

Подразделение Microsoft AI (MAI) под руководством Мустафы Сулеймана 2 апреля 2026 года выпустило три базовых модели. Они охватывают транскрипцию речи, генерацию аудио и генерацию изображений — области, в которых Microsoft до сих пор во многом зависел от сторонних поставщиков, в том числе от OpenAI.

Три модели

MAI-Transcribe-1 преобразует устную речь в текст на 25 языках. Модель позиционируется как решение speech-to-text для корпоративных приложений и developer-интеграций.

MAI-Voice-1 генерирует аудио из текста, производя до 60 секунд звука в секунду. Поддерживается создание кастомных голосов, что позволяет приложениям генерировать стабильные синтетические голоса, настроенные под конкретный бренд или персону.

Третья модель отвечает за генерацию изображений и была доступна в MAI Playground с 19 марта ещё до официального анонса.

Контекст

MAI было создано примерно за шесть месяцев до этого анонса как самостоятельное подразделение внутри Microsoft, отдельное от команды продуктов, выпускающей Copilot и AI-функции Microsoft 365. Его задача — формирование собственного стека базовых моделей, а не зависимость от моделей OpenAI в рамках существующего партнёрства.

Тайминг важен: соглашение Microsoft с OpenAI усложнилось по мере того, как OpenAI наращивал независимость и конкурировал с Microsoft на корпоративных рынках. Собственные мультимодальные возможности дают Microsoft больше гибкости в ценообразовании, развёртывании и дифференциации AI-продуктов в долгосрочной перспективе.

Почему это важно для продакт-менеджеров

Для PM, оценивающих корпоративные AI-инструменты, этот релиз добавляет Microsoft в список поставщиков, предлагающих собственные возможности распознавания речи и генерации изображений наряду с OpenAI, Google, Anthropic и ElevenLabs. Команды, работающие на Azure или Microsoft 365, могут получить доступ к этим моделям без смены вендора.

Общая тенденция заслуживает внимания: крупные платформенные компании последовательно движутся к тому, чтобы владеть всем стеком — от базовых моделей до пользовательских приложений. Для PM, строящих продукты на таких платформах, эта консолидация влияет на стоимость API, доступность моделей и степень влияния, которую любой отдельный вендор имеет над их продуктом.