Post Thumbnail

Reddit поймал Perplexity на краже контента

Я раньше рассказывал, что компания Reddit подала иск против искусственного интеллекта-поисковика Perplexity. Reddit обвиняет Perplexity в «промышленном» сборе контента. Но теперь есть факты и Reddit показал, как поймала ответчика в ловушку.

Чтобы подкрепить обвинения, в Reddit устроили эксперимент. Компания создала тестовый пост, который был доступен только для краулера Google и не был виден обычным пользователям и внешним сборщикам данных. По утверждению Reddit, содержимое этого поста уже через несколько часов появилось в ответах Perplexity. Для Reddit это прямое доказательство, что Perplexity через сторонних парсеров результатов поиска Google получает закрытые для неё данные. В тексте иска этот приём сравнивается с помеченными купюрами, которые используют следователи.

Reddit утверждает, что направлял Perplexity письмо с требованием прекратить доступ к контенту ещё в мае 2024 года. Но с того момента количество ссылок Perplexity на материалы Reddit «выросло в 40 раз». По версии Reddit, Perplexity и подрядчики сознательно обходили технические барьеры, чтобы вытянуть тексты с площадки.

Perplexity публично отвергает обвинения. Компания говорит, что не обучает свои базовые модели напрямую на данных Reddit. А лишь «суммирует публично доступные обсуждения».

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Gemini может стать мозгом для всех роботов на планете

Google сделала неожиданный ход. Компания наняла бывшего технического директора Boston Dynamics Аарона Сандерса вице-президентом по аппаратному обеспечению. И это не просто кадровое назначение.

Искусственный интеллект диагностирует болезни сердца через смарт-часы

Системы ИИ могут довольно точно выявлять серьёзные аномалии в здоровье сердечно-сосудистой системы даже по примитивным данным с Apple Watch.

Китайский робот с искусственным интеллектом замаскировался под медузу

Китайские учёные разработали почти неотличимого от медузы робота под названием «водный призрак». Благодаря скромному потреблению небольшое устройство способно длительно находиться в воде. И следить как за экосистемой океана, так и за подводной инфраструктурой, делая это максимально скрытно.

4 модели ИИ спорят между собой и выбирают лучший ответ

Бывший директор по искусственному интеллекту в Tesla Андрей Карпаты, выложил на GitHub свой «проект выходного дня». Приложение llm-council. Это «совет ИИ», где несколько языковых моделей параллельно готовят ответы и выбирают лучший.

Студент оказался умнее ИИ стоимостью миллиарды долларов

Мечта об учёном с искусственным интеллектом разбилась о реальность. Gemini 3 Pro и GPT-5 и 1 провалили задачи, с которыми справляется обычный аспирант.