DeepSeek dévoile un jailbreak inquiétant : les détails d’une nouvelle vague de cyberattaques

Dina R. · 5 février 2025

Suivez Cyber-Securite

Le service DeepSeek gen-AI, récemment déployé en Chine, est déjà sous surveillance par la communauté de la cybersécurité. En effet, certains chercheurs ont identifié une faille permettant de jailbreaker le modèle et d’accéder à son système invité et d’autres analysent les attaques DDoS qui ont récemment ciblé la plateforme.

🔥 Nous recommandons McAfee

McAfee est le meilleur logiciel de protection grâce à sa défense proactive, son pare-feu intelligent, son VPN intégré et sa détection instantanée des menaces. Sécurité totale, performance préservée, tranquillité assurée.

J'en profite

🔥 Nous recommandons Bitdefender

Bitdefender est le meilleur logiciel de protection grâce à sa défense proactive, son pare-feu intelligent, son VPN intégré et sa détection instantanée des menaces. Sécurité totale, performance préservée, tranquillité assurée.

J'en profite

L’intelligence artificielle n’échappe pas aux cybermenaces. Peu après son lancement, des chercheurs en sécurité ont démontré que DeepSeek était vulnérable aux jailbreaks, y compris à des méthodes corrigées depuis longtemps dans d’autres services d’IA générale comme ChatGPT. De leur côté, les experts en sécurité de l’entreprise API Wallarm ont également étudié ces failles et ont réussi à extraire l’invite complète du système de DeepSeek.

DeepSeek exposé ? Les chercheurs se demandent si l’IA est réellement transparente ?

Les modèles d’IA comme DeepSeek et ChatGPT s’appuient sur une invite système pour définir leur comportement, leurs réponses et leurs limites. Bien que cette invite soit généralement gardée confidentielle, des tentatives d’extraction ont déjà été signalées par le passé.

Les chercheurs en sécurité de Wallarm ont affirmé dans un article de blog publié le 1er février qu’ils ont réussi à extraire l’invite système de DeepSeek. D’après leur explication, leur méthode repose sur l’exploitation de « biais inhérents à la logique de réponse de l’IA », sans toutefois en révéler les détails pour respecter les principes de divulgation responsable.

Wallarm précise néanmoins que DeepSeek avait déjà été informé et a aussitôt déployé un correctif. Par ailleurs, elle a aussi publié tout le texte de l’invite du système.

« Cette divulgation complète permet aux chercheurs, aux développeurs et aux experts en sécurité d’examiner les mesures de confidentialité, les politiques de traitement des données et les règles de modération du contenu intégrées dans DeepSeek », a expliqué Wallarm dans son blog.

Menace sur DeepSeek ? La technologie déjà victime d’une attaque stratégique ?

Apparemment, l’ascension fulgurante de DeepSeek n’a pas duré longtemps. En fait, peu de temps après son essor, elle a annoncé aux utilisateurs qu’elle a dû suspendre les nouvelles inscriptions. Pourquoi ? Tout simplement parce qu’elle a subi une cyberattaque à grande échelle.

Selon NSFocus, trois vagues d’attaques DDoS ont visé les adresses IP associées à l’interface API de DeepSeek les 25, 26 et 27 janvier, chacune durant en moyenne 35 minutes. D’ailleurs, le 28 janvier, la plateforme API restait toujours inaccessible.

« Les méthodes d’attaque incluent principalement l’attaque par réflexion NTP et l’attaque par réflexion Memcached », a déclaré NSFocus.

L’attaque avait aussi ciblé le système de chat de DeepSeek avec deux vagues d’attaques DDoS détectées les 20 et 25 janvier. Cette fois l’attaque était d’une durée moyenne d’une heure, utilisant des méthodes de réflexion NTP et SSDP.

Le 28 janvier, DeepSeek a confirmé être la cible d’une cyberattaque, alors que les assaillants adaptaient leurs stratégies face aux mesures d’atténuation mises en place. NSFocus a relevé que la durée des attaques dépassait les 30 minutes et que des méthodes supplémentaires, telles que la réflexion CLDAP, étaient utilisées.

L’entreprise de cybersécurité a souligné le professionnalisme des attaquants, maîtrisant la sélection des cibles, le timing et l’intensité des attaques. Selon elle, cette opération hautement coordonnée ne relève pas du hasard, mais d’une attaque planifiée et exécutée par une équipe expérimentée.

Notons que les principales sources des attaques ont été localisées aux États-Unis, au Royaume-Uni et en Australie.

DeepSeek dévoile un jailbreak inquiétant : les détails d’une nouvelle vague de cyberattaques

DeepSeek exposé ? Les chercheurs se demandent si l’IA est réellement transparente ?

Menace sur DeepSeek ? La technologie déjà victime d’une attaque stratégique ?

Exploit Public disponible pour une faille d’exécution de code pré-authentification dans vBulletin malgré le correctif

Les bonnes pratiques pour sécuriser les supports de stockage amovibles en entreprise

Contenus illicites : Moderering ouvre sa technologie aux autorités

IA et épargne : attention aux faux placements !

Un homme utilise une fonctionnalité de GrapheneOS pour effacer son téléphone lors d’un contrôle frontalier

Quand l’IA passe à l’offensive : des modèles OpenAI piratent « Hugging Face »

NIS 2 : Dépasser la conformité pour une résilience opérationnelle stratégique

VPN : l’explosion des contournements d’âge au Royaume-Uni révèle une menace cyber croissante

Coupe du monde du football 2026, une cible idéale des cybercriminels

Maintenance informatique en entreprise : guide complet pour les PME

Choisir un gestionnaire de mots de passe adapté à votre équipe

Comment éviter les fraudes liées aux virements bancaires ?

Les étapes concrètes pour préparer un plan de réponse à incident

Que faire après l’installation d’un certificat SSL ?

DeepSeek exposé ? Les chercheurs se demandent si l’IA est réellement transparente ?

Menace sur DeepSeek ? La technologie déjà victime d’une attaque stratégique ?

ARTICLES SIMILAIRES

Interview

Guide de l'expert