Post Thumbnail

Anthropic a détruit des millions de livres pour l’entraînement d’IA après achat

Dans la procédure judiciaire avec Anthropic, des informations ont fait surface sur la façon dont l’entreprise collectait des matériaux pour l’entraînement de son intelligence artificielle. C’est une vraie opération spéciale à l’échelle du livre !

D’abord, l’entreprise a simplement emprunté 7 millions de livres des bibliothèques pirates. Mais ensuite a décidé d’agir plus légalement et a invité Tom Tervi. L’ancien responsable des relations partenaires dans le projet Google de numérisation de livres. Sa tâche sonnait ambitieuse – obtenir « tous les livres du monde » sans complications juridiques.

Après des tentatives échouées de négocier avec les éditeurs, l’équipe de Tervi est passée aux achats directs. Pour plusieurs millions de dollars, Anthropic a acquis des millions de livres papier, souvent d’occasion. Et puis la partie la plus intéressante a commencé !

Pour numériser ces livres, l’entreprise a embauché des contractants qui ont agi radicalement. De chaque livre ils ont retiré la couverture, l’ont séparé en pages individuelles, les ont scannées en PDF avec texte lisible par machine. Et ont détruit les originaux papier. Cette « numérisation destructive » n’est pas nouvelle dans les processus de numérisation, mais l’échelle est impressionnante.

D’un côté, les livres ont été honnêtement achetés. De l’autre côté, le fait de détruire des millions de livres papier fait réfléchir sur la valeur culturelle. Et l’éthique de telles méthodes d’obtention de données pour l’intelligence artificielle.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Étape historique : le millionième robot d'Amazon livré au Japon

Amazon a atteint une étape historique ! Et après 13 ans d'implémentation de robots dans ses entrepôts, l'entreprise a annoncé avoir atteint la barre du million d'appareils robotisés. Le millionième robot a été récemment livré à un entrepôt Amazon au Japon.

Nouvel An chinois annulé : Alibaba travaille la nuit sur une réponse à DeepSeek

Une vraie course technologique a éclaté en Chine, où les ingénieurs d'Alibaba ont fait face à une situation sans précédent. Ils ont dû annuler leurs congés. Et travailler même pendant le Nouvel An chinois. Et c'est l'une des fêtes les plus importantes et vénérées dans toute la Chine !

Perplexity sort un navigateur avec IA pour automatiser les tâches en ligne

L'entreprise Perplexity se prépare à sortir son propre navigateur avec intelligence artificielle intégrée. Le directeur exécutif de la startup Aravind Srinivas a annoncé que la sortie est déjà en phase finale. Et les utilisateurs peuvent soumettre des demandes d'accès anticipé via le site officiel. Lien dans la description.

Buterin a critiqué le projet World d'Altman pour menace à la pseudonymité

Le cofondateur d'Ethereum Vitalik Buterin a exprimé de sérieuses préoccupations concernant le projet World, l'enfant de Sam Altman ! C'est un différend technologique extrêmement intéressant sur l'avenir de l'identification numérique.

Amazon et Anthropic construisent un superordinateur 5 fois plus puissant que l'actuel

Anthropic et Amazon construisent quelque chose de colossal ! Les entreprises se sont unies pour créer le superordinateur Project Rainier. Le plus puissant de l'histoire d'Amazon Web Services. Il sera hébergé dans plusieurs centres de données sur tout le territoire des États-Unis.