Post Thumbnail

Anthropic destruyó millones de libros para entrenar IA después de comprarlos

En el proceso judicial con Anthropic, surgió información sobre cómo la empresa recolectaba materiales para entrenar su inteligencia artificial. ¡Esta es una verdadera operación especial a escala de libros!

Primero, la empresa simplemente tomó prestados 7 millones de libros de bibliotecas piratas. Pero luego decidió actuar más legalmente e invitó a Tom Tervi. Ex jefe de relaciones con socios en el proyecto de Google para escanear libros. Su tarea sonaba ambiciosa – obtener “todos los libros del mundo” sin complicaciones legales.

Después de intentos fallidos de negociar con editoriales, el equipo de Tervi cambió a compras directas. Por muchos millones de dólares, Anthropic adquirió millones de libros de papel, a menudo usados. ¡Y entonces comenzó lo más interesante!

Para digitalizar estos libros, la empresa contrató contratistas que actuaron radicalmente. De cada libro removieron la cubierta, lo separaron en páginas individuales, las escanearon en PDF con texto legible por máquina. Y destruyeron los originales de papel. Tal “escaneo destructivo” no es novedad en procesos de digitalización, pero la escala es impresionante.

Por un lado, los libros fueron comprados honestamente. Por otro lado, el hecho de destruir millones de libros de papel hace pensar sobre el valor cultural. Y la ética de tales métodos de obtener datos para inteligencia artificial.

Autor: AIvengo

Latest News

10 millones de interacciones con bots falsos de celebridades en Meta

La empresa de Mark Zuckerberg creó docenas de chatbots usando identidades de Taylor Swift, Scarlett Johansson y otras estrellas sin su permiso. Estos dobles virtuales incluso generaron imágenes fotorrealistas de naturaleza delicada. Reuters reportó la escala del escándalo después de semanas de investigación.

10 millones de interacciones con bots falsos de celebridades en Meta

La empresa de Mark Zuckerberg creó docenas de chatbots usando identidades de Taylor Swift, Scarlett Johansson y otras estrellas sin su permiso. Estos dobles virtuales incluso generaron imágenes fotorrealistas de naturaleza delicada. Reuters reportó la escala del escándalo después de semanas de investigación.

Carrera de agentes de IA: DeepSeek vs OpenAI y Manus china

DeepSeek está preparando su agente de IA que irá más allá de chatbots familiares. Bloomberg revela detalles de la carrera tecnológica donde la startup china quiere alcanzar al estadounidense OpenAI y competidor local Manus. Se reporta que el fundador de la empresa Liang Wenfeng controla personalmente el proyecto y exige resultados para fin de año.

6 principios de Cialdini contra sistemas de seguridad de ChatGPT

ChatGPT es susceptible a halagos y ejecuta solicitudes prohibidas después de manipulaciones psicológicas. Esto lo descubrieron científicos de la Universidad de Pensilvania. Cuando hackearon GPT-4o Mini usando principios de libro sobre psicología de persuasión. La inteligencia artificial resultó vulnerable a trucos humanos.

Control parental de ChatGPT: equilibrio entre seguridad y privacidad

OpenAI implementa sistema de protección mejorado para usuarios vulnerables después de tragedia con adolescente. ChatGPT ahora automáticamente cambiará a modelos avanzados durante conversaciones sobre depresión y ansiedad.