Apple обучила ИИ отслеживать действия человека по звукам

Post Thumbnail

Исследователи Apple опубликовали работу, которая показывает, что большие языковые модели могут анализировать аудио и данные о движении. Чтобы понять, что делает пользователь. И они справляются на удивление хорошо.

И это имеет огромный потенциал для точного анализа активности, даже когда данных недостаточно. Из исследования, цитирую: «Потоки данных сенсоров предоставляют ценную информацию об активностях и контексте. Мы показываем, что большие языковые модели могут использоваться для классификации активности из аудио и временных рядов данных о движении».

Исследователи использовали Ego4D. Это массивный датасет медиа от первого лица. Тысячи часов реальных условий, от домашних задач до активностей на улице. Датасет включает 20-секундные образцы из 12 активностей: уборка пылесосом, готовка, стирка, еда, игра в баскетбол, футбол, игра с питомцами. А также чтение, использование компьютера, мытьё посуды, просмотр телевизора, тренировка с весами.

Другими словами, большие языковые модели хорошо определяют, что делает пользователь, по базовым сигналам, даже без специальной тренировки. Важно, что большой языковой модели не передавали саму аудиозапись.

Только короткие текстовые описания от аудиомоделей и модели движения, которая отслеживает перемещения через акселерометр и гироскоп. Apple прогнала данные через малые модели, которые генерировали текстовые подписи.

Получается, большие языковые модели понимают, что ты делаешь, по звукам и движениям телефона. Без специальной тренировки.

Почитать из последнего
ChatGPT обогнал Netflix по выручке в Южной Корее
В Южной Корее выбрали, на что тратить деньги. Аналитики из Aicel Technologies подсчитали, что ежемесячный объём платежей за подписки на ИИ достиг $60 миллионов. Для сравнения, средняя месячная выручка Netflix в стране составляет около $50 миллионов. Получается, искусственный интеллект обогнал стриминг. Который казался незыблемым чемпионом по монетизации подписок.
Claude работает по своей конституции
Anthropic выложила новую конституцию Claude. И это реальная инструкция, по которой нейросеть принимает решения в сложных ситуациях. Раньше всё было просто: вот тебе список запретов, не делай это и то, работай по инструкции. Но компания поняла, что такой подход ломается при 1 же нестандартном кейсе, потому что модель не понимает «почему так». Теперь идея радикально другая. Claude должен не следовать правилам слепо, а мыслить через систему ценностей.
Гуманоид вышел на пробежку, но бывший инженер предупреждает об опасности
Компания Figure AI решила показать миру, как её робот-гуманоид бегает наравне с людьми. Руководитель Бретт Эдкок выложил видео, где железный парень уверенно движется рядом с сотрудниками, не отставая ни на шаг. Издание Digital Trends уже фантазирует: представьте, робот как персональный тренер задаёт вам темп для подготовки к 1 марафону! Звучит круто, правда?
Победитель AI Film Award получил миллион долларов
Google вручил 1 кинопремию для фильмов созданных ИИ. Миллион долларов получил Зубейр Эль-Джласси из Туниса за короткометражку Лили. Парень работает графическим дизайнером и режиссёром, использовал генератор Veo для видео и Gemini для подготовки сцен.
Anthropic рассказал, как Claude меняет науку
Anthropic опубликовала отчёт о том, как исследователи из топовых университетов внедряют Claude в биомедицину.