Apple обучила ИИ отслеживать действия человека по звукам

Post Thumbnail

Исследователи Apple опубликовали работу, которая показывает, что большие языковые модели могут анализировать аудио и данные о движении. Чтобы понять, что делает пользователь. И они справляются на удивление хорошо.

И это имеет огромный потенциал для точного анализа активности, даже когда данных недостаточно. Из исследования, цитирую: «Потоки данных сенсоров предоставляют ценную информацию об активностях и контексте. Мы показываем, что большие языковые модели могут использоваться для классификации активности из аудио и временных рядов данных о движении».

Исследователи использовали Ego4D. Это массивный датасет медиа от первого лица. Тысячи часов реальных условий, от домашних задач до активностей на улице. Датасет включает 20-секундные образцы из 12 активностей: уборка пылесосом, готовка, стирка, еда, игра в баскетбол, футбол, игра с питомцами. А также чтение, использование компьютера, мытьё посуды, просмотр телевизора, тренировка с весами.

Другими словами, большие языковые модели хорошо определяют, что делает пользователь, по базовым сигналам, даже без специальной тренировки. Важно, что большой языковой модели не передавали саму аудиозапись.

Только короткие текстовые описания от аудиомоделей и модели движения, которая отслеживает перемещения через акселерометр и гироскоп. Apple прогнала данные через малые модели, которые генерировали текстовые подписи.

Получается, большие языковые модели понимают, что ты делаешь, по звукам и движениям телефона. Без специальной тренировки.

Почитать из последнего
Более 30 000 врачей и юристов обучают нейросети делать их работу
Представьте картину: журналист с 20-летним стажем, которого выкинули в прошлом году, сидит и правит статьи, которые создал ИИ. 20-30 часов в неделю. За деньги. Чтобы машина научилась писать ещё лучше. Абсурд? Добро пожаловать в новую реальность белых воротничков.
Из-за ИИ теоретическая физика исчезнет через 10 лет
Физик-теоретик и популяризатор науки Сабина Хоссенфельдер, выдала интересный прогноз. Она считает, что через 3 года научные исследования в привычном виде перестанут существовать. А через 10 лет теоретическая физика как область человеческой деятельности может практически закончиться. Для решения задач будет достаточно просто купить вычислительное время нейросети. Звучит как антиутопия? Только вот процесс уже пошёл.
Nvidia и Siemens превратят завод в гигантского робота с ИИ
Глава Nvidia Дженсен Хуанг на выставке CES выдал очень интересную фразу, цитирую: "Эти производственные предприятия, по сути, станут гигантскими роботами". Так Nvidia и Siemens анонсировали создание Industrial AI Operating System. Платформы, которая внедрит ИИ во всю цепочку промышленного производства. От проектирования до логистики. Завод будущего не просто автоматизирован — он думает сам.
Крёстный отец SaaS уволил продажников и заменил их ИИ за полгода
Джейсон Лемкин, которого называют крёстным отцом SaaS и основателем сообщества SaaStr, публично заявил что больше не будет нанимать людей в отдел продаж своей компании. Вместо живых менеджеров теперь работают агенты на основе ИИ. По его словам, переход занял меньше года.
Создатель Signal запустил ИИ-ассистента с полной анонимностью
Создатель мессенджера Signal Мокси Марлинспайк, решил сделать с чат-ботами то же что сделал с мессенджерами. Добавить слой анонимности который не пробьёшь. Его новый проект Confer с открытым исходным кодом гарантирует что данные пользователей будут недоступны вообще никому. Ни оператору платформы, ни хакерам, ни правоохранителям, ни любой другой стороне кроме самих владельцев.