in ,

DeepSeek dévoile un jailbreak inquiétant : les détails d’une nouvelle vague de cyberattaques

DeepSeek jailbreak

Le service DeepSeek gen-AI, récemment déployé en Chine, est déjà sous surveillance par la communauté de la cybersécurité. En effet, certains chercheurs ont identifié une faille permettant de jailbreaker le modèle et d’accéder à son système invité et d’autres analysent les attaques DDoS qui ont récemment ciblé la plateforme.

L’intelligence artificielle n’échappe pas aux cybermenaces. Peu après son lancement, des chercheurs en sécurité ont démontré que DeepSeek était vulnérable aux jailbreaks, y compris à des méthodes corrigées depuis longtemps dans d’autres services d’IA générale comme ChatGPT. De leur côté, les experts en sécurité de l’entreprise API Wallarm ont également étudié ces failles et ont réussi à extraire l’invite complète du système de DeepSeek.

DeepSeek exposé ? Les chercheurs se demandent si l’IA est réellement transparente ?

Les modèles d’IA comme DeepSeek et ChatGPT s’appuient sur une invite système pour définir leur comportement, leurs réponses et leurs limites. Bien que cette invite soit généralement gardée confidentielle, des tentatives d’extraction ont déjà été signalées par le passé.

Les chercheurs en sécurité de Wallarm ont affirmé dans un article de blog publié le 1er février qu’ils ont réussi à extraire l’invite système de DeepSeek. D’après leur explication, leur méthode repose sur l’exploitation de « biais inhérents à la logique de réponse de l’IA », sans toutefois en révéler les détails pour respecter les principes de divulgation responsable.

 Wallarm précise néanmoins que DeepSeek avait déjà été informé et a aussitôt déployé un correctif. Par ailleurs, elle a aussi publié tout le texte de l’invite du système.

« Cette divulgation complète permet aux chercheurs, aux développeurs et aux experts en sécurité d’examiner les mesures de confidentialité, les politiques de traitement des données et les règles de modération du contenu intégrées dans DeepSeek », a expliqué Wallarm dans son blog.

Vous aimerez aussi cet article:

Menace sur DeepSeek ? La technologie déjà victime d’une attaque stratégique ?

Apparemment, l’ascension fulgurante de DeepSeek n’a pas duré longtemps. En fait, peu de temps après son essor, elle a annoncé aux utilisateurs qu’elle a dû suspendre les nouvelles inscriptions. Pourquoi ? Tout simplement parce qu’elle a subi une cyberattaque à grande échelle.

Selon NSFocus, trois vagues d’attaques DDoS ont visé les adresses IP associées à l’interface API de DeepSeek les 25, 26 et 27 janvier, chacune durant en moyenne 35 minutes. D’ailleurs, le 28 janvier, la plateforme API restait toujours inaccessible.

« Les méthodes d’attaque incluent principalement l’attaque par réflexion NTP et l’attaque par réflexion Memcached », a déclaré NSFocus.

L’attaque avait aussi ciblé le système de chat de DeepSeek avec deux vagues d’attaques DDoS détectées les 20 et 25 janvier. Cette fois l’attaque était d’une durée moyenne d’une heure, utilisant des méthodes de réflexion NTP et SSDP.

Le 28 janvier, DeepSeek a confirmé être la cible d’une cyberattaque, alors que les assaillants adaptaient leurs stratégies face aux mesures d’atténuation mises en place. NSFocus a relevé que la durée des attaques dépassait les 30 minutes et que des méthodes supplémentaires, telles que la réflexion CLDAP, étaient utilisées.

L’entreprise de cybersécurité a souligné le professionnalisme des attaquants, maîtrisant la sélection des cibles, le timing et l’intensité des attaques. Selon elle, cette opération hautement coordonnée ne relève pas du hasard, mais d’une attaque planifiée et exécutée par une équipe expérimentée.

Notons que les principales sources des attaques ont été localisées aux États-Unis, au Royaume-Uni et en Australie.