Post Thumbnail

Amenazas y $1 billón no mejoran el trabajo de las redes neuronales

Seguramente han visto estos “trucos secretos” para controlar redes neuronales. Como amenazas, promesas de recompensas, manipulaciones emocionales. ¿Pero realmente funcionan? Investigadores de la Universidad de Pennsylvania y Wharton School realizaron un experimento a gran escala con 5 modelos avanzados: Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini y GPT o4-mini.

A cada modelo le hicieron preguntas de nivel PhD en ciencias naturales y problemas complejos de ingeniería. Para excluir fluctuaciones aleatorias, cada consulta se repitió 25 veces.

¡Los resultados fueron interesantes! Ninguna de las 9 técnicas manipulativas mostró mejora estadísticamente significativa en la precisión de respuestas. ¡Ni amenazas de “patear un cachorro”, ni promesas de $1 billón, ni historias desgarradoras sobre una madre enferma ayudaron a los modelos a dar respuestas de mejor calidad!

Además, estos “trucos” hicieron los resultados menos estables. En algunos casos la precisión aumentó 36 puntos porcentuales, mientras en otros cayó 35! Incluso se documentaron casos donde el modelo ignoró completamente la pregunta principal, “quedándose atascado” en la parte manipulativa del prompt.

En lugar de trucos dudosos, los investigadores recomiendan una estrategia verdaderamente efectiva. Formulación clara de la tarea, especificación del formato de respuesta deseado y proporcionar contexto relevante.

Autor: AIvengo
Latest News
Jefe de Nvidia cree que no hay burbuja de IA

Fundador de Nvidia Jensen Huang disipó preocupaciones sobre burbuja en mercado de IA. Y según él, últimos chips de compañía se espera que traigan 0.5 billones de dólares en ingresos.

Sam Altman está cansado de preguntas sobre dinero

Sam Altman está cansado de preguntas sobre dinero de OpenAI. Y esto se hizo obvio durante entrevista conjunta con Satya Nadella en podcast Bg2.

Número de vacantes de ingenieros de despliegue avanzado creció 800%

Compañías de IA inventaron nueva profesión. Hablamos de ingenieros de despliegue avanzado.

OpenAI promete crear científico de IA completo para 2028

OpenAI prometió crear científico basado en IA completo para 2028. CEO de compañía Sam Altman también declaró que sistemas de aprendizaje profundo podrán realizar funciones de científicos investigadores a nivel de pasante para septiembre de próximo año. Y nivel de investigador de IA autónomo completo podría alcanzarse para 2028.

Empleos para jóvenes especialistas IT en Gran Bretaña colapsaron 46%

¿Saben qué está pasando en mercado laboral para jóvenes especialistas IT en Gran Bretaña? Durante último año, número de empleos para jóvenes especialistas colapsó 46%. Y se pronostica caída adicional de 53%, reporta The Register. Citando estadísticas de Institute of Student Employers.