Google Meet переводит в реальном времени с сохранением голоса говорящего

Post Thumbnail

Google представил революционную функцию перевода речи в реальном времени для своего сервиса видеоконференций Meet. Я в приятном шоке! Главная особенность этой технологии — способность не только переводить сказанное, но и сохранять индивидуальные характеристики голоса говорящего. Включая тембр, интонации и эмоциональные оттенки.

Работает система на базе искусственного интеллекта Gemini и позволяет участникам разговора общаться через языковой барьер, при этом сохраняя естественность коммуникации. На конференции I/O Google продемонстрировали эту технологию в действии. В демонстрации англоговорящий участник общался с коллегой на испанском языке. После активации функции Gemini система мгновенно начала переводить речь в обоих направлениях. Причём каждый участник слышал собеседника на своём родном языке с сохранением оригинальных голосовых характеристик.

На данный момент технология работает только с английским и испанским языками, но компания уже объявила о планах в ближайшие недели добавить поддержку итальянского, немецкого и португальского языков. Сейчас функция доступна для платных подписчиков Google Meet, а до конца года её планируют открыть для корпоративных клиентов.

Эта технология потенциально может изменить подход к международным коммуникациям, сделав их более естественными и эффективными для бизнеса, образования и личного общения с иностранными друзьями или родственниками.

Я реально удивлен! Синхронный перевод Google Meet фокусируется не только на точности передачи смысла, но и на сохранении паралингвистических элементов речи. Что делает коммуникацию между носителями разных языков максимально приближенной к естественному общению. Как же круто будет говорить с любым человеком на планете на любом языке. Очень жду эту технологию в широком доступе.

Почитать из последнего
Из-за ИИ клавиатуры исчезнут из офисов
Лондонская школа экономики совместно с Jabra выдала любопытный прогноз. К 28-му году голосовой ИИ станет стандартом в офисах. А поколение Альфа — рождённые после 2010 года — возможно, никогда не узнает, каково это писать email руками. Но пока мне не верится, что клавиатуры действительно исчезнут.
ChatGPT обогнал TikTok и Disney
ChatGPT заработал 3 миллиарда долларов на мобильных подписках. Цифра впечатляет, но ещё интереснее скорость, с которой её достигли.
Собаки-поводыри скоро станут робо-псами с ИИ
Инженеры из США и Южной Кореи превратили робо-пса Unitree Go2 в собаку-поводыря. Модель ИИ GuideNav использует одну обычную камеру вместо дорогих датчиков LiDAR. И это работает.
Американцы заваливают китайский ИИ деньгами
Американские инвесторы завалили китайских разработчиков ИИ деньгами. Несмотря на геополитическое противостояние. Получается, прибыль побеждает политику.
OpenAI и Anthropic внедряют распознавание детей
Компании OpenAI и Anthropic внедряют технологии распознавания несовершеннолетних пользователей чат-ботов. OpenAI обновила правила взаимодействия ChatGPT с пользователями от 13 до 17 лет. Anthropic работает над системой идентификации и блокировки пользователей младше 18.