Ir al contenido

My name is AIvengo and I bring you daily news updates about artificial intelligence

Reseñas

Estudio mostró 78% de probabilidad de denuncia de IA a autoridades regulatorias

AIvengo03.06.202503.06.2025

China explora uso de robots humanoides como material fungible en guerra

AIvengo03.06.202503.06.2025

Gerente top de compañía de IA miente públicamente sobre seguridad de tecnologías

AIvengo02.06.202502.06.2025

Filósofo finlandés probó presencia de libre albedrío en IA

AIvengo02.06.202502.06.2025

Cibercriminales de Vietnam disfrazan virus como generadores de video de IA

AIvengo02.06.202502.06.2025

Sundar Pichai anunció el comienzo de la segunda fase de la revolución de inteligencia artificial

AIvengo30.05.202530.05.2025

Built Robotics creó robots para automatización de industria solar

AIvengo30.05.202530.05.2025

Zuckerberg anunció 1 mil millones de usuarios mensuales de Meta AI

AIvengo30.05.202530.05.2025

Musk amenaza con arruinar acuerdo de OpenAI con EAU exigiendo incluir xAI en proyecto

AIvengo30.05.202530.05.2025

Ventas de cuadernos de examen crecieron 80% por lucha contra IA

AIvengo30.05.202530.05.2025

DeepSeek R1 superó a Qwen 3 y redujo brecha con Gemini 2.5 Pro

AIvengo30.05.202530.05.2025

CEO de Anthropic predijo crecimiento de desempleo del 20% por IA en 5 años

AIvengo30.05.202530.05.2025

Navegación de entradas

Entradas anteriores
Entradas siguientes

Latest video

  • 2 empresas de investigación independientes NeuralTrust y SPLX descubrieron vulnerabilidades críticas en el sistema de seguridad del nuevo modelo solo 24 horas después del lanzamiento de GPT-5. Para comparación, Grok-4 fue hackeado en 2 días, haciendo el caso de GPT-5 aún más alarmante.

    ¿Cómo pasó esto? Los especialistas de NeuralTrust aplicaron una combinación de su propia metodología EchoChamber y técnica de storytelling. Empujaron gradualmente al sistema hacia respuestas deseadas a través de una serie de consultas que no contenían formulaciones explícitamente prohibidas. El problema clave es que el sistema de seguridad de GPT-5 analiza cada consulta por separado pero no cuenta el efecto acumulativo del diálogo multi-etapa.

    El equipo SPLX tomó un enfoque diferente, aplicando exitosamente un ataque StringJoin Obfuscation. En este enfoque, ciertos símbolos se insertan en el texto que enmascaran una consulta potencialmente peligrosa. Después de una serie de preguntas guía, el modelo produjo contenido que debería haber sido bloqueado.

    Interesantemente, en análisis comparativo, el modelo GPT-4o anterior resultó más resistente a tales ataques. Según investigadores, el modelo base es prácticamente imposible de usar en aplicaciones corporativas "listo para usar" sin configuración adicional de mecanismos protectores.

    12.08.2025
  • Cloudflare asestó un golpe aplastante a Perplexity AI, bloqueando el acceso de la startup de búsqueda a miles de sitios. ¿La razón? ¡Escaneo oculto de recursos web de escala sin precedentes a pesar de prohibiciones explícitas de los propietarios!

    Según la investigación de Cloudflare, Perplexity empleaba métodos sofisticados para enmascarar sus bots como navegadores Chrome de usuarios ordinarios en macOS. Pero la estrategia de camuflaje digital no terminaba ahí. La empresa Perplexity cambiaba sistemáticamente direcciones IP, usando varios sistemas autónomos para eludir mecanismos protectores como restricciones robots.txt y actividad enmascarada.

    Cloudflare documentó de 3 a 6 millones de solicitudes enmascaradas de Perplexity diariamente. Lo que afectó a decenas de miles de dominios diferentes.

    La reacción de Perplexity solo añade dramatismo a la situación. El representante de la startup Jesse Dwyer rechazó categóricamente todas las acusaciones, llamando a la publicación de Cloudflare nada más que un "truco publicitario". ¡Y luego afirmó que el bot mencionado en el reporte no pertenece para nada a la empresa!

    Cloudflare excluyó los bots de Perplexity de su lista de rastreadores confiables e implementó mecanismos adicionales para bloquearlos.

    11.08.2025
  • Seguramente han visto estos "trucos secretos" para controlar redes neuronales. Como amenazas, promesas de recompensas, manipulaciones emocionales. ¿Pero realmente funcionan? Investigadores de la Universidad de Pennsylvania y Wharton School realizaron un experimento a gran escala con 5 modelos avanzados: Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini y GPT o4-mini.

    A cada modelo le hicieron preguntas de nivel PhD en ciencias naturales y problemas complejos de ingeniería. Para excluir fluctuaciones aleatorias, cada consulta se repitió 25 veces.

    ¡Los resultados fueron interesantes! Ninguna de las 9 técnicas manipulativas mostró mejora estadísticamente significativa en la precisión de respuestas. ¡Ni amenazas de "patear un cachorro", ni promesas de $1 billón, ni historias desgarradoras sobre una madre enferma ayudaron a los modelos a dar respuestas de mejor calidad!

    Además, estos "trucos" hicieron los resultados menos estables. En algunos casos la precisión aumentó 36 puntos porcentuales, mientras en otros cayó 35! Incluso se documentaron casos donde el modelo ignoró completamente la pregunta principal, "quedándose atascado" en la parte manipulativa del prompt.

    En lugar de trucos dudosos, los investigadores recomiendan una estrategia verdaderamente efectiva. Formulación clara de la tarea, especificación del formato de respuesta deseado y proporcionar contexto relevante.

    08.08.2025
  • Anthropic lanzó Claude Opus 4.1. Esto no es solo otra actualización, sino una mejora sustancial en capacidades de codificación y funcionalidad de agente. Lo que es especialmente agradable — la nueva versión está integrada no solo en la interfaz clásica de Claude, sino también en la herramienta Claude Code. Así como disponible a través de API, Amazon Bedrock y Google Cloud Vertex AI.

    ¡Opus 4.1 demuestra rendimiento récord de 74.5% en el benchmark SWE-bench Verified! GitHub nota ganancias significativas de rendimiento en la mayoría de métricas. Con énfasis especial en refactorización de código multi-archivo. El equipo de Rakuten Group destaca la precisión excepcional del modelo al hacer correcciones en grandes bases de código. Opus 4.1 encuentra exactamente esos lugares que requieren cambios sin afectar código funcional.

    Windsurf reporta un salto impresionante de rendimiento, comparable a la transición de Sonnet 3.7 a Sonnet 4.

    07.08.2025
  • ¡OpenAI lanzó los primeros modelos con código fuente abierto en los últimos 6 años! El lanzamiento prometido tuvo lugar.

    Los nuevos modelos gpt-oss-1-20b y gpt-oss-20b impresionan con su rendimiento, demostrando nivel o4-mini en benchmarks clave. Enlace en la descripción.

    ¡El modelo senior requiere solo una buena laptop, mientras que el junior puede funcionar incluso en un smartphone moderno!

    Configuración flexible de profundidad de razonamiento con 3 modos — low, medium y high. Esto permite equilibrar precisamente entre velocidad y calidad de respuestas. Y la capacidad incorporada de llamar herramientas en la cadena de razonamiento abre excelentes posibilidades para crear sistemas de agentes complejos.

    La licencia Apache 2.0 elimina prácticamente todas las restricciones. ¡Ahora estos modelos poderosos pueden integrarse en startups, productos comerciales y proyectos de investigación sin barreras legales!

    Una cosa me molesta. Hay censura. Si preguntas sobre cosas limítrofes - puede negarse a dar una respuesta.

    06.08.2025
  • Samsung Electronics, uno de los principales fabricantes de dispositivos móviles, busca activamente alternativas a Google Gemini para su futura línea Galaxy S26. La empresa está llevando a cabo negociaciones con OpenAI y Perplexity, esforzándose por expandir el ecosistema de inteligencia artificial en sus dispositivos.

    Esta información surgió de comentarios del jefe de la división correspondiente de Samsung, Choi Won Choon, en una entrevista con Bloomberg. Según él, para el momento del lanzamiento de la nueva línea insignia, el gigante surcoreano planea ofrecer a los usuarios una selección más amplia de asistentes inteligentes y características.

    Al mismo tiempo, Samsung no abandona el desarrollo de sus propias tecnologías. La empresa continúa trabajando en la creación de funciones de IA propietarias. Que podrían convertirse en una ventaja única de nuevos modelos de smartphones de esta marca. Además, el fabricante está considerando la posibilidad de devolver los procesadores Exynos de producción propia a la línea insignia para el momento del lanzamiento del Galaxy S26. Aunque no planea abandonar completamente los chips Qualcomm.

    04.08.2025
Online publication about artificial intelligence AIvengo: media where you can read and see the latest news about artificial intelligence © 2025