Post Thumbnail

Anthropic уничтожила миллионы книг для обучения ИИ после покупки

В судебном разбирательстве с Anthropic всплыла информация о том, как компания собирала материалы для обучения своего искусственного интеллекта. Это настоящая спецоперация книжного масштаба!

Сначала компания просто позаимствовала 7 млн книг из пиратских библиотек. Но потом решила действовать легальнее и пригласила Тома Терви. Бывшего руководителя партнёрских отношений в проекте Google по сканированию книг. Его задача звучала амбициозно – раздобыть «все книги в мире» без юридических сложностей.

После неудачных попыток договориться с издательствами команда Терви переключилась на прямые покупки. За многие млн долларов Anthropic приобрела млн бумажных книг, часто подержанных. А дальше началось самое интересное!

Для оцифровки этих книг компания нанимала подрядчиков, которые действовали радикально. С каждой книги снимали обложку, разделяли на отдельные страницы, сканировали их в PDF с машиночитаемым текстом. А бумажные оригиналы уничтожали. Такое «деструктивное сканирование» – не новинка в процессах оцифровки, но масштаб впечатляет.

С 1 стороны, книги были честно куплены. С другой – факт уничтожения млн бумажных книг заставляет задуматься о культурной ценности. И этичности таких методов получения данных для искусственного интеллекта.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Исторический рубеж: миллионный робот Amazon доставлен в Японию

Amazon достиг исторического рубежа! И после 13 лет внедрения роботов в свои складские помещения, компания объявила о достижении отметки в 1 млн роботизированных устройств. Миллионный робот был недавно доставлен на склад Amazon в Японии.

Китайский Новый год отменен: Alibaba работает ночами над ответом DeepSeek

Настоящая технологическая гонка вспыхнула в Китае, где инженеры Alibaba столкнулись с беспрецедентной ситуацией. Им пришлось отменить отпуска. И работать даже во время Китайского Нового года. А ведь это 1 из самых значимых и почитаемых праздников во всём Китае!

Perplexity выпускает браузер с ИИ для автоматизации онлайн-задач

Компания Perplexity готовится выпустить собственный браузер с интегрированным искусственным интеллектом. Исполнительный директор стартапа Аравинд Шринивас объявил, что релиз уже находится на финальной стадии. И пользователи могут подавать заявки на ранний доступ через официальный сайт. Ссылка в описании.

Бутерин раскритиковал проект World Альтмана за угрозу псевдонимности

Сооснователь Ethereum Виталик Бутерин высказал серьёзные опасения насчёт проекта World, детища Сэма Альтмана! Это крайне интересный технологический спор о будущем цифровой идентификации.

Amazon и Anthropic строят суперкомпьютер в 5 раз мощнее текущего

Anthropic и Amazon строят нечто колоссальное! Компании объединились для создания суперкомпьютера Project Rainier. Самого мощного в истории Amazon Web Services. Он будет размещаться в нескольких центрах обработки данных по всей территории США.