Post Thumbnail

Google Meet переводит в реальном времени с сохранением голоса говорящего

Google представил революционную функцию перевода речи в реальном времени для своего сервиса видеоконференций Meet. Я в приятном шоке! Главная особенность этой технологии — способность не только переводить сказанное, но и сохранять индивидуальные характеристики голоса говорящего. Включая тембр, интонации и эмоциональные оттенки.

Работает система на базе искусственного интеллекта Gemini и позволяет участникам разговора общаться через языковой барьер, при этом сохраняя естественность коммуникации. На конференции I/O Google продемонстрировали эту технологию в действии. В демонстрации англоговорящий участник общался с коллегой на испанском языке. После активации функции Gemini система мгновенно начала переводить речь в обоих направлениях. Причём каждый участник слышал собеседника на своём родном языке с сохранением оригинальных голосовых характеристик.

На данный момент технология работает только с английским и испанским языками, но компания уже объявила о планах в ближайшие недели добавить поддержку итальянского, немецкого и португальского языков. Сейчас функция доступна для платных подписчиков Google Meet, а до конца года её планируют открыть для корпоративных клиентов.

Эта технология потенциально может изменить подход к международным коммуникациям, сделав их более естественными и эффективными для бизнеса, образования и личного общения с иностранными друзьями или родственниками.

Я реально удивлен! Синхронный перевод Google Meet фокусируется не только на точности передачи смысла, но и на сохранении паралингвистических элементов речи. Что делает коммуникацию между носителями разных языков максимально приближенной к естественному общению. Как же круто будет говорить с любым человеком на планете на любом языке. Очень жду эту технологию в широком доступе.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Китайский робот-сфера RT-G весом 150 кг развивает скорость до 35 км/ч

В Китае есть такое уникальное инженерное чудо — сферический робот Rotunbot RT-G. Который может кардинально поменять представление о полицейских технологиях будущего.

22% британских детей 8-12 лет используют ИИ, не зная что это такое

22% британских школьников от 8 до 12 лет уже активно используют инструменты искусственного интеллекта. Несмотря на то, что большинство из них даже не слышали термин "генеративный искусственный интеллект". Это данные исследования Института Алана Тьюринга и Lego Foundation.

Первая реклама на Google Veo 3 показана миллионам во время финала NBA

Миллионы зрителей финальной серии NBA стали свидетелями абсолютно нового этапа в креативной эволюции. Полностью сгенерированной компьютерными алгоритмами рекламы букмекерской платформы Kalshi, созданной с помощью Google Veo 3.

Китайская платформа QiMeng создает процессоры уровня Intel 486 и Arm

Китайские ученые разработали новый искусственный интеллект-платформу, способную самостоятельно проектировать процессоры на уровне человеческих экспертов. Исследователи из Государственной лаборатории по разработке процессоров и Исследовательского центра интеллектуального программного обеспечения представили проект с открытым исходным кодом под названием QiMeng.

Meta AI превращает личные чаты с ИИ в публичные посты без ведома

Приложение Meta AI оказалось настоящей катастрофой для конфиденциальности пользователей. Превращая их личные разговоры с искусственным интеллектом в публичный контент. Представьте себе современный фильм ужасов: вся ваша история запросов оказалась общедоступной, а вы даже не подозревали об этом.