Reddit поймал Perplexity на краже контента
Я раньше рассказывал, что компания Reddit подала иск против искусственного интеллекта-поисковика Perplexity. Reddit обвиняет Perplexity в «промышленном» сборе контента. Но теперь есть факты и Reddit показал, как поймала ответчика в ловушку.
Чтобы подкрепить обвинения, в Reddit устроили эксперимент. Компания создала тестовый пост, который был доступен только для краулера Google и не был виден обычным пользователям и внешним сборщикам данных. По утверждению Reddit, содержимое этого поста уже через несколько часов появилось в ответах Perplexity. Для Reddit это прямое доказательство, что Perplexity через сторонних парсеров результатов поиска Google получает закрытые для неё данные. В тексте иска этот приём сравнивается с помеченными купюрами, которые используют следователи.
Reddit утверждает, что направлял Perplexity письмо с требованием прекратить доступ к контенту ещё в мае 2024 года. Но с того момента количество ссылок Perplexity на материалы Reddit «выросло в 40 раз». По версии Reddit, Perplexity и подрядчики сознательно обходили технические барьеры, чтобы вытянуть тексты с площадки.
Perplexity публично отвергает обвинения. Компания говорит, что не обучает свои базовые модели напрямую на данных Reddit. А лишь «суммирует публично доступные обсуждения».