Skip to content
Новость TechCrunch март 2026 г.

Mistral выпустила Voxtral TTS — опенсорсную модель для генерации речи

26 марта 2026 года Mistral выпустила Voxtral TTS — модель синтеза речи с 4 миллиардами параметров, доступную в виде открытых весов под лицензией CC BY-NC 4.0. Модель поддерживает девять языков (английский, французский, немецкий, испанский, нидерландский, португальский, итальянский, хинди, арабский), генерирует первый аудиофрагмент примерно за 90 миллисекунд и способна клонировать голос по трём-пяти секундам эталонного аудио.

В сравнительных тестах с ElevenLabs Flash v2.5 Voxtral показала 68,4% побед в тестах человеческих предпочтений по многоязычному клонированию голоса. По качеству звучания модель сопоставима с ElevenLabs v3. Для самостоятельного развёртывания достаточно одного GPU с 16 ГБ видеопамяти и весами в формате BF16; модель также разработана для запуска на периферийных устройствах — ноутбуках и смартфонах — после квантизации.

Для журналистов и авторов наиболее прямые сценарии использования: озвучивание статей и новостных рассылок, создание подкаст-эпизодов из письменных сценариев, транскрипция и дублирование интервью для многоязычной аудитории, генерация доступных аудиоверсий документов. Функция клонирования голоса — адаптация к акценту и интонации конкретного диктора по короткому эталонному фрагменту — позволяет создавать однородный голосовой вывод без поминутных затрат на API.

Веса доступны на Hugging Face под идентификатором mistralai/Voxtral-4B-TTS-2603 бесплатно для некоммерческого и исследовательского использования. Коммерческое применение весов требует отдельного соглашения с Mistral. Для команд, предпочитающих API, а не самостоятельное развёртывание, Mistral предлагает Voxtral TTS через свою платформу по цене $0,016 за 1000 символов.

Лицензия CC BY-NC отличает Voxtral от моделей Mistral Voxtral для распознавания речи, которые выпущены под Apache 2.0. Командам, строящим коммерческие продукты, стоит уточнить, какая лицензия применима к их конкретному сценарию, перед развёртыванием.