Inworld выпустил голосовой движок, который в 4 раза быстрее всех конкурентов
Пока ElevenLabs и OpenAI мерялись качеством голосов, Inworld тихо подкрался сзади и выстрелил новой версией своего движка текст-в-речь. И знаете что? Они не просто догнали конкурентов. Они их обошли по всем фронтам. Компания заявляет, что это самый быстрый и качественный голосовой ИИ реального времени на рынке. И лидерборд Artificial Analysis это подтверждает. Первое место – не шутка.
Главная фишка – скорость. Версия Mini выдаёт задержку меньше 130 миллисекунд, что идеально для гипер-чувствительных задач типа живых диалогов с ботами. Версия Max чуть медленнее – меньше 250 миллисекунд. Зато максимальное качество звука. И это в 4 раза быстрее предыдущих поколений! Представьте разговор с ИИ, где пауз практически нет – вот это реальное время, а не маркетинговая сказка.
Но скорость – это ещё не всё. Модель стала на 30 процентов эмоциональнее и делает на 40 процентов меньше ошибок распознавания. Разработчики также обещают звучание уровня профессиональных актёров озвучки. А теперь самое вкусное – цена. Mini стоит 0.5 цента за минуту, Max – 1 цент за минуту аудио. Это копейки по сравнению с тем, что берут конкуренты.
Плюс поддержка 15 языков включая русский.
Кажется, рынок голосового ИИ только что стал намного интереснее. И когда появляется игрок с лучшей скоростью, качеством и ценой одновременно, гиганты начинают нервничать. Посмотрим, как ElevenLabs и OpenAI будут отвечать на этот вызов.