-
Modelo de IA RoboBrain 2.0 ahora puede combinar percepción de ambiente y control de robots en 1 sistema compacto. Especialistas ya lo llaman base para futura generación de robots humanoides.
RoboBrain soporta planificación, análisis de ambiente y ejecución de acciones en mundo real. Al mismo tiempo, modelo contiene solo 7 mil millones de parámetros. Lo que lo hace fácil para integración en proyectos existentes y sistemas robóticos. Todo código fuente está disponible en repositorio abierto en GitHub.
Arquitectura técnica impresiona con sus capacidades. Sistema procesa imágenes, secuencias de video largas y datos visuales de alta resolución. Al mismo tiempo, entiende excelentemente instrucciones de texto complejas. Información visual pasa a través de codificador especial y proyector. Y texto se convierte en flujo unificado de tokens. Luego decodificador realiza razonamiento, construye planes y determina coordenadas espaciales.
Con tal ritmo de desarrollo, es bastante realista que para 2027 veamos producción masiva de robots avanzados similares a humanos.
-
App Tinder lanzó función de cita doble que permite a usuarios unirse con amigos para encontrar parejas. Ahora puedes invitar hasta 3 amigos y juntos explorar perfiles de otros llamados equipos. Que tienen al menos 1 coincidencia en preferencias individuales.
¿Cómo funciona? Cuando 1 persona de la pareja obtiene coincidencia, chat grupal con todos 4 participantes se crea automáticamente. Mientras mantiene posibilidad de dar like a perfil separado para comunicación personal 1-a-1. Además dijeron ahí que inteligencia artificial verifica intereses, datos y coincidencias por preferencias.
Cleo Long, jefa del departamento de marketing de producto de Tinder, nota que durante pruebas, usuarios se sentían más cómodos comunicándose en pareja con amigo. Esto llevó a interacción más activa. Formato grupal ayuda aliviar tensión y simplifica planificación de encuentros – ya sean reuniones amistosas o citas románticas.
Según ellos, usuarios en chats grupales envían 25% más mensajes que en conversaciones normales. Y volumen total de mensajes en tales chats es 35% más alto, especialmente entre audiencia menor de 29 años.
Esta es respuesta de Tinder a declive del 5% en número de suscriptores pagados.
-
Apareció nuevo benchmark LiveCodeBench Pro para evaluar capacidades de programación de inteligencia artificial. Enlace en descripción. Incluye tareas más difíciles y frescas de competencias populares. Olimpiada Internacional de Informática y Campeonato Mundial de Programación. Tareas fueron marcadas por ganadores y premiados de estas competencias ellos mismos.
Resultados muestran imagen interesante. Incluso mejor modelo o4-mini-high alcanza solo calificación de 2100. Para comparación, programadores gran maestros tienen alrededor de 2700. Brecha permanece enorme.
Modelos solo pueden lidiar con tareas simples y algunas medianas. En asignaciones verdaderamente difíciles, todos modelos de lenguaje muestran 0 absoluto. Resuelven tareas de combinatoria y programación dinámica bastante bien. Pero en teoría de juegos y trabajo con casos límite, su nivel es como experto promedio o incluso estudiante.
Curioso es diferencia en tipos de errores. Personas usualmente cometen errores de implementación por desatención o problemas de sintaxis. En modelos de IA, problemas surgen más frecuentemente a nivel de idea de solución misma. Entonces no se prevé reemplazo para programadores olímpicos aún.
-
Inteligencia artificial, destinada a convertirse en locomotora de progreso tecnológico, está comenzando a frenar su propio desarrollo. Según The Register, modelos generativos han llenado internet con tanto contenido sintético que esto crea verdadero callejón sin salida tecnológico.
Y observamos formación de "círculo vicioso digital". Nuevos modelos de IA cada vez más se entrenan en materiales creados por versiones previas de IA. Resultado se parece al juego clásico de "teléfono descompuesto". Donde cada participante subsecuente pasa información cada vez más distorsionada. En círculos profesionales, este escenario recibió nombre "colapso de modelo".
¡Emerge analogía sorprendente con acero pre-nuclear! Así como metal producido antes de primeras pruebas nucleares en julio 1945 es valorado por ausencia de radionúclidos, datos hasta 2022 se convierten en recurso invaluable debido a "contaminación" mínima por contenido sintético.
Maurice Chiodo, investigador del Centro de Estudios de Riesgo Existencial en Universidad de Cambridge, enfatiza: acceso a "datos limpios" es críticamente importante para prevenir degradación de modelos.
-
Sam Altman reveló públicamente caza de talento sin precedentes que conduce Mark Zuckerberg. Jefe de Meta ofrece a empleados de OpenAI sumas verdaderamente astronómicas. ¡$100 millones solo como bono de entrada!
Sin embargo, a pesar de cifras vertiginosas, ninguno de ingenieros y científicos de OpenAI ha mordido cebo dorado aún. Razón, según Altman, radica en valores más profundos de su equipo. Sam Altman dijo, cito: "Nuestra gente valora legado más que estatus financiero instantáneo."
Interesante, estas declaraciones francas fueron hechas en podcast conducido por propio hermano de Sam, Jack Altman. Así conversación familiar se convirtió en declaración pública.
Jefe de OpenAI no se contuvo en expresiones al caracterizar competidor. Declaró abiertamente que Meta sufre de cultura corporativa débil y experimenta problemas serios con innovación. "Sabemos muchas cosas sobre éxito que ni siquiera sospechan allá," notó.
En opinión de Altman, es precisamente OpenAI que tiene mejores oportunidades de alcanzar verdadera superinteligencia y ultimadamente convertirse en compañía más valiosa.
-
Servicio Midjourney lanzó esperado generador de video Midjourney Video V1. Esta es herramienta fundamentalmente nueva con posibilidades impresionantes para expresión creativa personal.
Tecnología funciona según principio de conversión de imagen a video. Usuarios pueden seleccionar imagen generada o subir propia, presionar botón Animate. Y sistema automáticamente mejora prompt para crear escena dinámica. Modo manual también está previsto, permitiendo describir detalladamente qué elementos exactos necesitan ser animados.
Desarrolladores ofrecieron 2 configuraciones clave. "Low motion" para escenas lentas y atmosféricas y "high motion" para secuencias dinámicas. Duración máxima de video es 16 segundos. Con posibilidad de extensión secuencial de 4 segundos.
Estética de material de salida corresponde completamente a estilo característico de Midjourney — con hermosa reproducción de colores y composición. Sistema maneja excelentemente dinámica de movimientos e incluso anatomía de figuras humanas. Sin embargo, detalle todavía deja que desear — artefactos visibles y resolución reducida de 480 píxeles, lo que es inferior a incluso algunas soluciones de código abierto.
Equipo Midjourney ve este lanzamiento como parte de estrategia comprehensiva para crear sistema de simulación 3D completo con control interactivo de objetos y espacio.