OpenAI готовит армию говорящих устройств и новую голосовую модель

Post Thumbnail

Издание The Information выяснило забавную вещь про OpenAI. Оказывается, когда вы общаетесь с ChatGPT голосом, вы разговариваете совсем не с той моделью, которая отвечает текстом. Голосовая версия 4o не получила ни одного обновления после выхода GPT-5. Она не умеет думать, не знает про цепочки рассуждений. Ничего из того, чем хвастались в последних релизах. Просто старая добрая болтушка, застывшая в прошлом году.

И по данным издания, за последние 2 месяца OpenAI экстренно объединила несколько инженерных, продуктовых и исследовательских команд. Чтобы срочно подтянуть аудионаправление. Компания планирует выпустить новую аудиомодель в 1-м квартале этого года. Новая архитектура, по словам источников, позволит генерировать ответы, которые звучат естественнее и эмоциональнее, плюс давать более точную информацию.

Главная фишка – модель научится одновременно говорить и адекватно реагировать, когда её перебивают. Текущие версии на это не способны – они тупо ждут, пока вы закончите, как вежливый робот из 90-х.

И оказывается, OpenAI разрабатывает не одно устройство, а целое семейство девайсов, которые будут выпускать постепенно. Среди обсуждаемых идей – умные очки и смарт-динамик без дисплея, где взаимодействие идёт преимущественно голосом. Только вот проблема: большая часть пользователей ChatGPT до сих пор общается текстом. Голосовой режим относительно популярен, но явно не доминирует.

Что всё это значит? А то, что OpenAI сначала должна приучить людей разговаривать вслух с ИИ, прежде чем выпускать армию говорящих устройств. Компания рвётся на рынок девайсов, но технология отстаёт, а пользователи упорно жмут на клавиатуру.

Почитать из последнего
Samsung хотят обойти Apple по ИИ-функциям и вернуть лидерство
В прошлом году Samsung поставила на рынок 400 миллионов мобильных устройств с ассистентом Google Gemini. Этого, видимо, показалось мало. В этом году южнокорейский гигант намерен удвоить количество до 800 миллионов штук. Тэ Мун Ро, один из двух гендиректоров Samsung Electronics, объяснил агентству Reuters это просто. Компания стремится распространить функции ИИ на все устройства и все услуги как можно скорее.
Alibaba научила алгоритм видеть рак там, где врачи пропускают
Каменщик 57 лет в Китае пришёл в больницу проверить диабет. Обычный осмотр, ничего особенного. Через 3 дня ему звонит заведующий отделением поджелудочной железы, мол приезжайте срочно. ИИ, который прогнал его КТ-снимок, нашёл опухоль. Оказалось – рак, но на ранней стадии. Вырезали и мужчина выжил. Без этой технологии его бы нашли слишком поздно, когда 5-летняя выживаемость около 10%.
OpenAI к 2028 году увеличит мощности дата-центров в 90 раз
Epoch AI сделал публично доступным трекер крупнейших дата-центров. А человек из твиттера с ником Peter Gostev визуализировал суммарные мощности по месяцам в разрезе компаний, и цифры просто убийственные.
Робот с лазером собрал 20 млн долларов, чтобы выжигать сорняки ярче солнца
Carbon Robotics привлекла 20 миллионов долларов на разработку третьей линейки продуктов. Компания делает роботов, которые выжигают сорняки лазером и работают в 14 странах. А за всем этим стоит большая растительная модель, которую разрабатывали с первых дней.
Шведский подросток бросил школу и теперь работает научным сотрудником в OpenAI
Габриэлю Петерссону 23 года, он бросил школу в глухом шведском городке и никогда не учился в университете. Но прямо сейчас он работает научным сотрудником в OpenAI в команде Sora. И Габриэль рассказал, как у него так получилось.