Post Thumbnail

Anthropic a détruit des millions de livres pour l’entraînement d’IA après achat

Dans la procédure judiciaire avec Anthropic, des informations ont fait surface sur la façon dont l’entreprise collectait des matériaux pour l’entraînement de son intelligence artificielle. C’est une vraie opération spéciale à l’échelle du livre !

D’abord, l’entreprise a simplement emprunté 7 millions de livres des bibliothèques pirates. Mais ensuite a décidé d’agir plus légalement et a invité Tom Tervi. L’ancien responsable des relations partenaires dans le projet Google de numérisation de livres. Sa tâche sonnait ambitieuse – obtenir “tous les livres du monde” sans complications juridiques.

Après des tentatives échouées de négocier avec les éditeurs, l’équipe de Tervi est passée aux achats directs. Pour plusieurs millions de dollars, Anthropic a acquis des millions de livres papier, souvent d’occasion. Et puis la partie la plus intéressante a commencé !

Pour numériser ces livres, l’entreprise a embauché des contractants qui ont agi radicalement. De chaque livre ils ont retiré la couverture, l’ont séparé en pages individuelles, les ont scannées en PDF avec texte lisible par machine. Et ont détruit les originaux papier. Cette “numérisation destructive” n’est pas nouvelle dans les processus de numérisation, mais l’échelle est impressionnante.

D’un côté, les livres ont été honnêtement achetés. De l’autre côté, le fait de détruire des millions de livres papier fait réfléchir sur la valeur culturelle. Et l’éthique de telles méthodes d’obtention de données pour l’intelligence artificielle.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.
Latest News
CodeClash a montré énorme écart entre IA et programmeur humain

CodeClash a été présenté. C'est un nouveau benchmark pour évaluer les compétences en programmation des grands modèles de langage. Et il a montré : l'écart avec le niveau humain est énorme.

Michael Burry a parié 1,1 milliard de dollars contre Nvidia et Palantir

Michael Burry - c'est un investisseur légendaire qui a prédit la crise des subprimes de 2008. Et maintenant il fait à nouveau un coup retentissant. Michael a parié 1,1 milliard de dollars en options de vente contre 2 grandes entreprises du secteur de l'IA. Ce sont Nvidia et Palantir.

XPeng a présenté premier robot humanoïde féminin au monde

Le constructeur automobile électrique chinois XPeng a présenté le robot humanoïde de nouvelle génération IRON. Et c'est le premier humanoïde féminin !

Anthropic mène interviews avec modèles avant envoi à la retraite

Anthropic a publié une politique de "mise hors service" des versions IA obsolètes. L'engagement clé est de préserver les poids de tous les modèles publics et activement utilisés en interne pendant au moins la durée de vie de l'entreprise. Pour qu'à l'avenir l'accès puisse être restauré si nécessaire.

Chef de Nvidia croit qu'il n'y a pas de bulle IA

Le fondateur de Nvidia Jensen Huang a dissipé les inquiétudes concernant une bulle sur le marché de l'IA. Et selon lui, les dernières puces de l'entreprise devraient rapporter 0,5 billion de dollars de revenus.