Самая дорогая компания в мире попалась на краже миллионов книг

Nvidia всегда была образцом технологической добродетели, правда? Ну так вот, компанию только что обвинили в том, что она украла миллионы пиратских книг для обучения своих нейросетей. И это не какие-то там домыслы. Речь идёт о расширенной коллективной жалобе группы авторов.

История разворачивается как детективный триллер. По версии истцов, представители Nvidia под конкурентным давлением решили обратиться к Anna’s Archive. Это теневая библиотека, где хранятся незаконно собранные книги. Компания интересовалась высокоскоростным доступом к этим материалам для тренировки больших языковых моделей. И самое пикантное то, что администрация Anna’s Archive честно предупредила, что библиотека нелегальная. И попросила внутреннего одобрения сделки от руководства. Угадайте, что произошло? Согласно жалобе, через неделю топ-менеджмент Nvidia дал зелёный свет!

Речь шла о 500 терабайтах данных. А это миллионы книг. Авторы утверждают, что их произведения использовали для обучения ИИ без разрешения и денег. А Nvidia при этом получила коммерческую выгоду. Но погодите, это ещё не всё! В расширенном иске компанию Nvidia обвиняют также в скачивании книг из других официальных и неофициальных библиотек. LibGen, Sci-Hub, Z-Library и использовании датасета Books3.

Получается, что гонка за превосходство в искусственном интеллекте толкает даже самую дорогую компанию в мире на откровенное пиратство.