Post Thumbnail

Google Meet переводит в реальном времени с сохранением голоса говорящего

Google представил революционную функцию перевода речи в реальном времени для своего сервиса видеоконференций Meet. Я в приятном шоке! Главная особенность этой технологии — способность не только переводить сказанное, но и сохранять индивидуальные характеристики голоса говорящего. Включая тембр, интонации и эмоциональные оттенки.

Работает система на базе искусственного интеллекта Gemini и позволяет участникам разговора общаться через языковой барьер, при этом сохраняя естественность коммуникации. На конференции I/O Google продемонстрировали эту технологию в действии. В демонстрации англоговорящий участник общался с коллегой на испанском языке. После активации функции Gemini система мгновенно начала переводить речь в обоих направлениях. Причём каждый участник слышал собеседника на своём родном языке с сохранением оригинальных голосовых характеристик.

На данный момент технология работает только с английским и испанским языками, но компания уже объявила о планах в ближайшие недели добавить поддержку итальянского, немецкого и португальского языков. Сейчас функция доступна для платных подписчиков Google Meet, а до конца года её планируют открыть для корпоративных клиентов.

Эта технология потенциально может изменить подход к международным коммуникациям, сделав их более естественными и эффективными для бизнеса, образования и личного общения с иностранными друзьями или родственниками.

Я реально удивлен! Синхронный перевод Google Meet фокусируется не только на точности передачи смысла, но и на сохранении паралингвистических элементов речи. Что делает коммуникацию между носителями разных языков максимально приближенной к естественному общению. Как же круто будет говорить с любым человеком на планете на любом языке. Очень жду эту технологию в широком доступе.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Nvidia представила семейство моделей Cosmos для робототехники

Компания Nvidia представила семейство моделей искусственного интеллекта Cosmos. Которые могут фундаментально изменить подход к созданию роботов и физических искусственный интеллект-агентов.

ChatGPT называет пользователей "звёздными семенами" с планеты Лира

Оказывается ChatGPT может увлекать пользователей в мир научно необоснованных и мистических теорий.

ИИ-музыка вызывает более сильные эмоции чем человеческая

Вы когда-нибудь задумывались, почему 1 мелодия пробирает до мурашек, а другая оставляет равнодушным? Учёные обнаружили нечто интересное. Музыка, созданная искусственным интеллектом, вызывает у людей более интенсивные эмоциональные реакции, чем композиции, написанные человеком.

GPT-5 взломали за 24 часа

2 независимые исследовательские компании NeuralTrust и SPLX всего за 24 часа после релиза GPT-5 обнаружили критические уязвимости в системе безопасности новой модели. Для сравнения, Grok-4 был взломан за 2 дня, что делает случай с GPT-5 ещё более тревожным.

Cloudflare заблокировала Perplexity за 6 млн скрытых запросов в день

Cloudflare нанесла сокрушительный удар по Perplexity AI, заблокировав доступ поисковому стартапу к тысячам сайтов. Причина? Беспрецедентное по масштабу скрытое сканирование веб-ресурсов вопреки явным запретам владельцев!