
La société israélienne Lasso, spécialisée dans la cybersécurité dans le domaine de l’intelligence artificielle générative, a découvert un problème de sécurité grave: les données qui étaient accessibles sur internet même pour une courte durée continuent d’exister dans la mémoire des chatbots d’IA même après leur suppression ou leur passage en mode privé.
L’ampleur du problème s’est avérée impressionnante: plus de 20 000 dépôts GitHub, qui sont maintenant privés, sont toujours accessibles via Microsoft Copilot. Cette vulnérabilité affecte plus de 16 000 organisations, y compris des géants technologiques comme Google, IBM, PayPal, Tencent et Microsoft elle-même.
L’histoire a commencé lorsque Lasso a découvert son propre dépôt, qui avait été accidentellement rendu public pendant une courte période, dans les réponses de Copilot. « Si vous naviguez sur le web, vous ne verrez pas ces données. Mais n’importe quelle personne dans le monde peut poser à Copilot la bonne question et obtenir cette information », explique le cofondateur de Lasso, Ofir Dror.
L’étude a montré que le problème est lié au mécanisme de mise en cache du moteur de recherche Bing de Microsoft. Lasso a analysé une liste de dépôts qui étaient publics à un moment donné en 2024, puis ont été supprimés ou passés en mode privé. Il s’est avéré que les données de ces dépôts sont toujours accessibles via Copilot.
Cette découverte soulève de sérieuses questions sur la sécurité des données à l’ère de l’IA générative. Même une brève divulgation d’informations confidentielles peut entraîner des conséquences à long terme, car les systèmes d’IA indexent et conservent ces données, les rendant potentiellement accessibles à tout utilisateur qui connaît les bonnes questions.
La situation est particulièrement remarquable car elle affecte les plus grandes entreprises technologiques du monde, y compris le développeur de l’outil lui-même – Microsoft. Cela démontre que même les organisations disposant du plus haut niveau d’expertise technique peuvent faire face à de nouveaux défis de sécurité créés par les systèmes d’intelligence artificielle.