Post Thumbnail

Anthropic a détruit des millions de livres pour l’entraînement d’IA après achat

Dans la procédure judiciaire avec Anthropic, des informations ont fait surface sur la façon dont l’entreprise collectait des matériaux pour l’entraînement de son intelligence artificielle. C’est une vraie opération spéciale à l’échelle du livre !

D’abord, l’entreprise a simplement emprunté 7 millions de livres des bibliothèques pirates. Mais ensuite a décidé d’agir plus légalement et a invité Tom Tervi. L’ancien responsable des relations partenaires dans le projet Google de numérisation de livres. Sa tâche sonnait ambitieuse – obtenir “tous les livres du monde” sans complications juridiques.

Après des tentatives échouées de négocier avec les éditeurs, l’équipe de Tervi est passée aux achats directs. Pour plusieurs millions de dollars, Anthropic a acquis des millions de livres papier, souvent d’occasion. Et puis la partie la plus intéressante a commencé !

Pour numériser ces livres, l’entreprise a embauché des contractants qui ont agi radicalement. De chaque livre ils ont retiré la couverture, l’ont séparé en pages individuelles, les ont scannées en PDF avec texte lisible par machine. Et ont détruit les originaux papier. Cette “numérisation destructive” n’est pas nouvelle dans les processus de numérisation, mais l’échelle est impressionnante.

D’un côté, les livres ont été honnêtement achetés. De l’autre côté, le fait de détruire des millions de livres papier fait réfléchir sur la valeur culturelle. Et l’éthique de telles méthodes d’obtention de données pour l’intelligence artificielle.

Auteur: AIvengo
Depuis 5 ans, je travaille dans l'apprentissage automatique et l'intelligence artificielle. Et ce domaine ne cesse de m'étonner, de m'inspirer et de m'intéresser.

Latest News

Seulement 1 programmeur au monde a pu battre l'IA d'OpenAI

Imaginez un monde où l'intelligence artificielle concourt avec les meilleurs programmeurs de la planète. Une telle confrontation a eu lieu lors du prestigieux tournoi AtCoder World Tour Finals. C'est l'une des compétitions de programmation les plus élitistes au monde, où il est extrêmement difficile d'entrer.

Un ancien ingénieur d'OpenAI a raconté le chaos à l'intérieur de l'entreprise

Vous voulez savoir ce qui se passe vraiment à l'intérieur d'OpenAI ? L'ancien ingénieur Calvin French-Owen a révélé tous les détails après avoir quitté l'entreprise il y a 3 semaines.

Salaire jusqu'à 170 000$ : Ce que SpaceX offre aux développeurs IA

SpaceX fait un tournant inattendu dans sa stratégie technologique. L'entreprise d'Elon Musk a ouvert des postes vacants pour des ingénieurs logiciels dans le domaine de l'intelligence artificielle. Formant une équipe qui s'occupera de résoudre les tâches de traitement de données les plus complexes pour les lanceurs et véhicules spatiaux.

Musk avec 248 milliards de dollars n'achète pas de PC de travail mais espionne les employés

L'entreprise xAI a commencé à surveiller ses employés directement sur leurs ordinateurs personnels ! Les employés qui entraînent l'intelligence artificielle Grok depuis leurs appareils ont été obligés d'installer des programmes de suivi.

Kimi-K2 avec 1 billion de paramètres a dépassé GPT-4.1 en programmation

L'entreprise technologique chinoise Moonshot AI a présenté un nouveau joueur dans l'arène de l'IA ! Rencontrez Kimi-K2. C'est un grand modèle de langage avec du code source ouvert, prêt à défier les leaders industriels reconnus comme Claude Sonnet 4 et GPT-4.1. Et un tel démarrage bruyant et puissant rappelle l'apparition de Deepseek.