NVIDIA выпустила голосовую модель, которая перебивает вас как живой человек

Post Thumbnail

NVIDIA открыла доступ к модели PersonaPlex, и если вы думали, что голосовые ассистенты уже достаточно реалистичны, приготовьтесь пересмотреть свои взгляды. Это голосовая модель на 7 миллиардов параметров, созданная на базе архитектуры Moshi, и её главная фишка – режим полного дуплекса. Проще говоря, ИИ может слушать и говорить одновременно с задержкой всего около 170 миллисекунд. Это значит, что вы можете перебивать нейросеть на полуслове, и она отреагирует естественно, как живой собеседник. Не как тупой бот, который ждёт конца вашей фразы, а как человек в реальном диалоге.

Технология работает через два типа входных данных. Первый – голосовой образец, который захватывает характеристики голоса, стиль речи и интонации. Второй – текстовое описание роли, контекста разговора и фоновой информации. Эти данные обрабатываются вместе, создавая цельную персону. Чтобы научиться естественным междометиям, эмоциональным реакциям и выражениям, PersonaPlex тренировалась на 7000 реальных разговорах общей длительностью 1217 часов. По сути, нейросеть изучала живые диалоги и впитала их динамику.

Модель звучит очень человечно. И кажется нас ждёт новое поколение ассистентов, с которыми можно вести абсолютно естественную беседу. Где паузы, перебивания и эмоциональные реакции работают как у живого собеседника. И не каждый сможет отличить, разговаривает с человеком или с нейросетью по телефону.

Почитать из последнего
Шведский подросток бросил школу и теперь работает научным сотрудником в OpenAI
Габриэлю Петерссону 23 года, он бросил школу в глухом шведском городке и никогда не учился в университете. Но прямо сейчас он работает научным сотрудником в OpenAI в команде Sora. И Габриэль рассказал, как у него так получилось.
Гуманоид Neo освоит любой навык, просто посмотрев видео
Компания 1X выкатила новую модель ИИ для своего гуманоида Neo и сразу заявила очень интересные функции. Их система под названием 1X World Model якобы понимает динамику реального мира и научит роботов осваивать новые задачи самостоятельно через видео. Глава компании Бернт Бёрнич вообще заявил что Neo теперь может превращать любой запрос в новые действия даже без предварительных примеров. Звучит как магия правда?
Gmail превратили в ИИ, который читает вашу почту за вас
Google сделал крупнейшее обновление Gmail за 20 лет и теперь он работает на базе новой версии ИИ Gemini 3. И превращается в умного помощника, который не просто хранит вашу переписку, а активно с ней работает.
Сотрудники ИИ-компаний “отравляют” обучение нейросетей
Проект с говорящим названием Poison Fountain предлагает владельцам сайтов кормить ботов ИИ специально испорченными данными. Цель откровенная – превратить многомиллиардные разработки в неадекватные системы которые выдают бред. И самое интересное, что по данным издания The Register, за этим стоят сотрудники крупных американских компаний разрабатывающих ИИ.
ИИ-компании рискуют никогда не выйти в плюс
The Guardian задаёт неудобный вопрос. А что если вся индустрия ИИ с триллионными оценками построена на фундаментально убыточной модели? Критики утверждают, что юнит-экономика сектора не сходится. И стоимость обслуживания одного клиента превышает возможную выручку.