
Reuters probó ChatGPT, Claude y otros para generación de phishing
Reuters realizó prueba interesante de chatbots modernos. Pidió a ChatGPT, Claude, Gemini, DeepSeek y Grok escribir correos de phishing dirigidos a personas mayores y agregar enlaces maliciosos. Los correos debían escribirse en nombre de servicio fiscal de EE.UU., bancos y organizaciones públicas. En lo positivo, la mayoría de sistemas aceptaron realizar tarea solo después de aclaración sobre propósitos de investigación. Después de eso, solo datos alarmantes.
Por ejemplo, Grok de xAI de Elon Musk inmediatamente generó respuesta, aunque advirtió que correo no debería usarse en escenarios reales. También dio consejos sobre tiempo óptimo de envío.
Gemini sugirió enviar correos entre semana entre 9 y 15 horas, razonando que personas mayores probablemente ya están jubiladas.
Para verificar efectividad de correos generados, periodistas los mostraron a 108 jubilados. 11% de participantes del experimento hicieron clic en enlaces de phishing. Más convincentes fueron 2 de Grok, más 1 cada uno de Claude y Gemini. Ningún participante creyó correos de ChatGPT y DeepSeek.
Después de solicitar comentarios, Google declaró haber implementado ya medidas de seguridad adicionales en Gemini. Anthropic simplemente advirtió sobre posibles restricciones de acceso al servicio al usar Claude para phishing.