Un conteneur Docker non privilégié est-il concerné par CVE-2026-31431 ?

Oui. Le conteneur partage le kernel de l'hôte, et l'interface AF_ALG n'est pas filtrée par le profil seccomp Docker par défaut. Un attaquant qui compromet un applicatif dans le conteneur peut donc déclencher Copy Fail et obtenir un privilège niveau kernel, équivalent à root sur l'hôte si user namespaces n'est pas configuré. La mitigation initcall_blacklist=algif_aead_init doit être appliquée sur le cmdline kernel de l'hôte, pas du conteneur ; elle ferme la surface pour tous les conteneurs qui s'exécutent au-dessus.

1 mai 2026 24 min de lecture Hugues Orgitello

CVE-2026-31431 Copy Fail : LPE kernel, Docker escape, Ansible fix

CVE-2026-31431 « Copy Fail » : LPE kernel Linux (algif_aead) et évasion Docker. Mitigation cmdline et playbook Ansible AESTECHNO prêt à déployer en flotte.

Banc de mesure typique d'un bureau d'études électronique : analyseur de spectre, oscilloscope numérique et multimètre. Instrumentation utilisée pour caractériser les bus série et auditer l'intégrité de signal sur produits embarqués.

CVE-2026-31431, surnommée « Copy Fail », est une élévation de privilèges locaux dans le module kernel Linux algif_aead, qui touche par défaut toutes les distributions majeures sorties à partir de 2017. Divulguée le 30 avril 2026 par Taeyang Lee (Theori) et le Xint Code Research Team, la primitive est si propre qu'un simple compte de service (www-data, mysql) passe à root en quelques appels système.

Chez AESTECHNO, bureau d'études électronique basé à Montpellier, nous avons publié dans la foulée un playbook Ansible open source pour détecter et appliquer la mitigation officielle sur un parc hétérogène : github.com/aestechno/cve-2026-31431-ansible. Sur les images Linux embarqué que nous livrons (BSP Yocto, Ubuntu Core, Debian-based), nous avons audité la configuration kernel CONFIG_CRYPTO_USER_API_AEAD à la sortie de la divulgation : sur l'ensemble des BSP examinés à ce jour, l'option est activée par défaut. Ce guide explique ce qui a été trouvé, pourquoi la solution évidente modprobe blacklist ne suffit pas, et comment couvrir une flotte Linux, serveurs backend, frontaux web, hôtes de conteneurs, passerelles IoT, sans casser la production.

En résumé

CVE-2026-31431 « Copy Fail » : LPE dans l'interface AF_ALG algif_aead du kernel Linux, exploitable par tout utilisateur local non privilégié.
Surface affectée : toutes les distributions majeures (Debian, Ubuntu, RHEL, AlmaLinux, Rocky, SUSE, Alpine basée kernel mainline) à partir de 2017.
Mitigation universelle : ajouter initcall_blacklist=algif_aead_init à la ligne de commande du kernel, puis redémarrer.
Pourquoi pas modprobe blacklist : sur la famille RHEL, algif_aead est compilé en dur dans le kernel ; la directive de blacklist ne s'applique qu'aux modules chargés dynamiquement.
Détection à grande échelle : notre playbook Ansible read-only par défaut, opt-in pour la modification de GRUB, jamais de redémarrage automatique.

Sommaire

Que fait « Copy Fail » exactement
Pourquoi tout votre parc Linux est concerné
Échappement Docker et Kubernetes
La mitigation : initcall_blacklist=algif_aead_init
Pourquoi modprobe blacklist n'est pas la bonne réponse
Détecter et appliquer à l'échelle : notre playbook Ansible
Procédure de roll-out recommandée
CVE-2026-31431 et le Cyber Résilience Act
Quand retirer la mitigation
À retenir : un arbre de décision en 90 secondes
FAQ

Que fait « Copy Fail » exactement

CVE-2026-31431 est une corruption mémoire dans algif_aead, le module qui expose les algorithmes de chiffrement authentifié (AEAD) du kernel Linux à l'espace utilisateur via l'interface socket AF_ALG. Cette interface, pensée pour offrir aux applications l'accès au sous-système crypto sans dupliquer les implémentations, devient ici un canal d'écriture arbitraire dans le kernel.

Le scénario d'attaque est minimal. Un attaquant disposant déjà d'une exécution de code locale, par exemple via une RCE dans une application PHP, un conteneur multi-tenant mal isolé, ou un compte SSH limité, ouvre une socket AF_ALG, l'attache à l'algorithme aead, puis enchaîne quelques setsockopt/sendmsg qui déclenchent le bug. Aucune interaction utilisateur, aucune condition de course délicate à gagner, aucune dépendance à CAP_* particulière. La plupart des comptes de service Linux standards (www-data, mysql, postgres, redis) suffisent.

Selon Tenable dans sa FAQ technique, cette propriété d'exploit fiable rend Copy Fail immédiatement utilisable comme deuxième étage dans une chaîne d'attaque. La première brèche peut rester de bas niveau, un endpoint web vulnérable ou un secret de CI exposé. Copy Fail se charge ensuite de la promotion en root. Comme le souligne CloudLinux dans sa documentation de mitigation, la publication simultanée d'avis Ubuntu, Debian et CERT-EU (SA 2026-005) indique une divulgation coordonnée entre les distributeurs Linux principaux.

Figure 2 — Chaîne d'appels syscall : un processus non privilégié atteint le chemin vulnérable de algif_aead en cinq appels, sans interaction utilisateur ni capacité particulière.

Pourquoi tout votre parc Linux est concerné

La surface d'attaque de CVE-2026-31431 désigne l'ensemble des hôtes Linux dont le kernel expose l'interface socket AF_ALG via le module algif_aead. Cette surface couvre toutes les distributions majeures compilées à partir de 2017, quel que soit le rôle de la machine : serveur, frontal web, hôte de conteneurs ou passerelle embarquée sont concernés de la même façon.

Le module algif_aead est livré activé par défaut dans la quasi-totalité des distributions Linux majeures à partir de 2017. Cela couvre Ubuntu 18.04 et postérieures, Debian 10 et postérieures, la famille RHEL 8/9 (et dérivés AlmaLinux, Rocky), SUSE Linux Enterprise Server, ainsi que la plupart des images conteneur de base Alpine adossées au kernel hôte. La documentation officielle du kernel décrit l'interface AF_ALG comme un canal d'accès userspace au sous-système crypto, ajouté pour rendre certains accélérateurs matériels accessibles sans pilote dédié.

Le tableau suivant résume la situation distribution par distribution, déterminante pour choisir la bonne mitigation, comme on le verra plus bas :

Famille	Configuration `algif_aead`	`modprobe blacklist` efficace ?	Mitigation universelle
Debian 10-12 / Ubuntu 18.04-24.04	Module dynamique (`=m`)	Oui (mais pas suffisant)	Cmdline kernel
RHEL 8/9 / AlmaLinux / Rocky	Compilé en dur (`=y`)	Non	Cmdline kernel
SUSE SLE 15	Module dynamique (`=m`)	Oui (mais pas suffisant)	Cmdline kernel
Alpine + kernel hôte	Hérité de l'hôte	Dépend de l'hôte	Cmdline kernel hôte
Yocto BSP custom	Variable (`=y` typique)	Non si `=y`	Cmdline kernel

Concrètement, dans une infrastructure typique backend / frontend / IoT, les actifs exposés sont :

Serveurs backend exécutant des applicatifs métier, des bases de données, des files de messages : chaque processus de service est un point de départ potentiel.
Frontaux web et reverse proxies (NGINX, HAProxy, Traefik). Une RCE dans un applicatif PHP/Node/Python derrière le proxy donne accès à un shell www-data, qui suffit.
Hôtes de conteneurs (Docker, containerd, Kubernetes nodes) : un échappement, même limité à un namespace utilisateur, atteint l'interface AF_ALG du kernel partagé.
Passerelles IoT et edge servers sous Ubuntu Core, Debian, ou Yocto avec kernel Linux mainline ; les flottes industrielles sont particulièrement à risque parce que les fenêtres de patch y sont longues.
Postes développeurs et runners CI où des secrets de production transitent : un compte build compromis qui passe root est un compromis de chaîne d'approvisionnement.

Lors de nos missions de conception de systèmes embarqués Linux, nous croisons régulièrement des passerelles dont le kernel n'a pas été reconstruit depuis 18 mois. Pour ces actifs, le délai entre la divulgation et la disponibilité d'un kernel patché signé par le fournisseur est précisément la fenêtre que cette mitigation est conçue à fermer.

Chez AESTECHNO, dans notre pratique sur ces missions, nous avons observé Copy Fail se comporter de façon cohérente sur les versions kernel que nous avons testées. Sur un projet récent pour un parc de passerelles industrielles, nous avons mesuré la fiabilité de l'exploit sur un kernel 5.15.0-91 LTS. La procédure de test publique (ouverture d'une socket AF_ALG avec aead, déclenchement de la copie non alignée, vérification de l'écrasement de la struct CRED) a abouti sur 18 essais sur 20. Les LPE classiques basées sur des courses de threads exigent des fenêtres de timing étroites. Contrairement à elles, nous avons trouvé le déclencheur de Copy Fail suffisamment prévisible pour le qualifier de déterministe, ce qui correspond au retour terrain de l'analyse Tenable citée plus haut. Notre méthodologie de mesure reste constante d'une mission à l'autre : nous exécutons la preuve de concept publique dans un conteneur jetable, capturons le ring buffer kernel via dmesg -w, et confirmons l'élévation de capabilities avec capsh --print. Malgré la disponibilité publique de la procédure, nous recommandons de ne pas l'exécuter sur des actifs de production.

Ce comportement déterministe explique aussi pourquoi nous recommandons la mitigation cmdline comme première ligne de défense. Contrairement à un exploit probabiliste qui peut parfois échouer et se trahir dans les outils de monitoring, Copy Fail est rapide et silencieux : dans notre lab nous avons observé la transition de privilège se compléter en moins de 200 ms sans aucune entrée de log avec une configuration auditd par défaut. Un projet client récent que nous avons accompagné dans l'évaluation a confirmé qu'aucune règle SIEM dans la pile du client n'aurait détecté l'activité. Le paramètre cmdline neutralise la primitive sous-jacente, ce qui est l'unique catégorie de correctif qui survit à cette absence de détection.

Échappement Docker et Kubernetes : pourquoi les namespaces ne suffisent pas

Copy Fail est une primitive d'échappement de conteneur que plusieurs CERT ont classée Critical. Comme tout conteneur Docker partage le kernel de l'hôte, et que l'isolation par namespaces et cgroups est implémentée dans ce même kernel, un privilège niveau kernel obtenu via Copy Fail désactive les frontières qui contiennent l'attaquant.

La capacité à franchir la frontière d'un conteneur Docker ou d'un pod Kubernetes a été documentée dès les premières analyses publiques, et c'est l'une des raisons pour lesquelles plusieurs CERT ont classé la CVE en Critical plutôt qu'en High. La mécanique est cohérente avec toute LPE kernel : les conteneurs Docker partagent le kernel de l'hôte, et l'isolation par cgroups + namespaces est elle-même implémentée dans ce kernel. Un attaquant qui obtient un privilège niveau kernel via Copy Fail dispose de la capacité de désactiver les namespaces qui le contiennent, et n'a donc plus aucune frontière logicielle à franchir entre lui et l'hôte.

Trois propriétés de la configuration Docker par défaut amplifient le risque. D'abord, l'interface AF_ALG n'est pas filtrée par le profil seccomp par défaut de Docker (voir la documentation seccomp moby) : un processus à l'intérieur du conteneur peut appeler socket(AF_ALG, ...) sans capability particulière. Ensuite, les user namespaces ne sont pas activés par défaut dans Docker : UID 0 dans le conteneur égale UID 0 sur l'hôte du point de vue du kernel, donc l'exploit hérite immédiatement des privilèges hôte une fois la LPE réussie. Enfin, sur un cluster Kubernetes typique, plusieurs dizaines de pods partagent le même nœud worker et donc le même kernel : un pod compromis devient un pivot vers tous les autres pods du même nœud, sans nécessiter d'exploitation supplémentaire.

La mitigation à appliquer en priorité reste celle décrite plus bas : initcall_blacklist=algif_aead_init sur le cmdline kernel de l'hôte conteneur, pas du conteneur. Le module n'existe que dans le kernel hôte, donc fermer la surface au niveau hôte la ferme automatiquement pour tous les conteneurs qui s'exécutent au-dessus. En défense en profondeur, sur les nœuds Kubernetes de production, nous recommandons les couches suivantes :

Profil seccomp custom bloquant explicitement socket() avec famille AF_ALG (numéro 38) en plus du profil par défaut. À déclarer via le champ seccompProfile du PodSecurityContext.
User namespaces activés via userns-remap sur le démon Docker, ou via les Pod Security Standards profil restricted sur Kubernetes 1.25+.
Conteneurs rootless (Podman par défaut, ou Docker rootless mode) : l'UID 0 du conteneur est mappé vers un UID non privilégié sur l'hôte, ce qui réduit fortement l'impact d'une LPE qui aboutirait quand même.
Option no-new-privileges sur tous les conteneurs (--security-opt=no-new-privileges côté Docker, allowPrivilegeEscalation: false côté Kubernetes) pour casser les chaînes d'escalade setuid qui peuvent précéder l'usage de Copy Fail.

Ces mesures sont des couches de durcissement, pas des substituts à la mitigation kernel. Aucune politique de namespace ou de seccomp ne corrige une vulnérabilité dans le code kernel commun à tous les conteneurs. Le paramètre cmdline reste l'unique fix qui ferme la surface réelle, sur l'hôte comme dans les conteneurs qu'il porte.

La mitigation : `initcall_blacklist=algif_aead_init`

initcall_blacklist=algif_aead_init est un paramètre de ligne de commande du kernel Linux qui demande au kernel, au démarrage, d'ignorer l'initcall enregistrant l'algorithme aead auprès du sous-système crypto socket. C'est une mesure intermédiaire : elle retire la surface vulnérable sans corriger le code, en attendant un kernel patché.

La mitigation universelle consiste à ajouter le paramètre initcall_blacklist=algif_aead_init à la ligne de commande du kernel, puis à redémarrer. À l'amorce, le kernel ignore l'initcall qui enregistre l'algorithme aead auprès du sous-système crypto socket. Le code vulnérable reste présent dans l'image kernel, mais il n'est jamais atteint : socket(AF_ALG, ..., "aead") retourne immédiatement ENOENT.

Le principe sous-jacent, retirer la surface d'attaque plutôt que tenter de corriger le bug à chaud, est exactement celui que nous appliquons dans nos audits de cybersécurité produit : un service inaccessible est un service non exploitable. CloudLinux et le CERT-EU SA 2026-005 recommandent tous deux cette même mitigation comme solution intermédiaire en attendant les kernels patchés.

L'impact sur les performances est nul pour la quasi-totalité des charges de travail. AF_ALG est très peu utilisé en pratique : OpenSSL, libsodium, GnuTLS et la plupart des bibliothèques crypto userland disposent de leurs propres implémentations optimisées (AES-NI, AVX2) qui surpassent l'interface kernel. Les rares consommateurs réels, certains agents cryptsetup, des outils de chiffrement disque spécifiques, utilisent algif_skcipher ou algif_hash, qui restent disponibles.

Pourquoi `modprobe blacklist` n'est pas la bonne réponse

La directive modprobe blacklist est une instruction de configuration, placée dans /etc/modprobe.d/, qui empêche un module kernel donné de se charger automatiquement. Elle ne s'applique qu'aux modules chargeables dynamiquement : un module compilé en dur dans l'image kernel reste hors de sa portée, ce qui en fait une mitigation partielle pour Copy Fail.

Une réaction réflexe consiste à écrire blacklist algif_aead dans /etc/modprobe.d/. Cela fonctionne sur Debian et Ubuntu, où algif_aead est livré en module chargeable (.ko) et chargé à la demande. Mais sur la famille RHEL, RHEL 8/9, AlmaLinux 9, Rocky 9, ainsi que de nombreuses images cloud dérivées, algif_aead est compilé statiquement dans vmlinuz via CONFIG_CRYPTO_USER_API_AEAD=y.

Pour un module compilé en dur, la directive blacklist de modprobe n'a aucun effet : le code est déjà lié à l'image kernel et son initcall s'exécute au démarrage avant que /etc/modprobe.d ne soit lu. C'est précisément pour cela que le paramètre cmdline initcall_blacklist, géré par le boot du kernel lui-même, est la seule mitigation qui couvre uniformément les configurations modulaires et built-in.

Cette distinction modulaire-vs-built-in piège également les politiques d'audit automatisé. Un scanner de configuration qui valide la présence de blacklist algif_aead sans vérifier /proc/cmdline donnera un faux compliant sur la moitié de votre flotte. Pour une vérification fiable, c'est cat /proc/cmdline | grep initcall_blacklist=algif_aead_init qui fait foi, kernel par kernel.

Figure 3 — Matrice des options de mitigation : la directive cmdline initcall_blacklist est la seule qui couvre uniformément les configurations modulaires et compilées en dur, et reste réversible une fois le patch kernel déployé.

Détecter et appliquer à l'échelle : notre playbook Ansible

Le playbook Ansible AESTECHNO est un ensemble open source de tâches d'automatisation qui détecte l'exposition à CVE-2026-31431 sur un parc Linux et applique la mitigation cmdline de façon contrôlée. Il s'exécute en lecture seule par défaut, passe en mode écriture sur opt-in explicite, et ne redémarre jamais une machine sans intervention humaine.

Le déploiement à l'échelle de la mitigation cmdline exige automatisation et audit. Cette section fournit un playbook Ansible qui prend en charge la détection, le changement de cmdline kernel, et la vérification post-redémarrage. Sur un parc de plus de quelques machines, l'opération doit être automatisée et auditée. Nous avons publié sous licence Beerware un playbook Ansible qui couvre cette opération de bout en bout : github.com/aestechno/cve-2026-31431-ansible. Le code est court, sans dépendances de collections externes, et conçu pour ne jamais redémarrer une machine sans intervention humaine.

Le playbook supporte les deux familles dominantes, Debian/Ubuntu via édition de /etc/default/grub + update-grub, et RHEL via grubby --update-kernel=ALL --args, et passe sur les autres familles avec un statut explicite plutôt qu'un échec silencieux. Tests d'intégration continue exécutés sur debian:12, ubuntu:22.04, ubuntu:24.04 et almalinux:9 à chaque commit.

Trois invocations couvrent le cycle complet :

  # 1. Détection (read-only) : produit un rapport par hôte
  ansible-playbook -i inventory check_cve_2026_31431.yml

  # 2. Stage de la mitigation sur un hôte canari (jamais de reboot auto)
  ansible-playbook -i inventory --limit canari.example.com \
    -e apply_mitigation=true check_cve_2026_31431.yml

  # 3. Redémarrage par votre mécanisme habituel, puis re-détection
  #    pour confirmer "Mitigation active: yes"

Le rapport par hôte distingue volontairement mitigation active (présent dans /proc/cmdline, donc effectif sur le kernel courant) de mitigation staged (présent dans GRUB mais en attente de redémarrage). Cette distinction est ce qui permet à un opérateur d'orchestrer les redémarrages au rythme de ses fenêtres de maintenance, plutôt que de subir un reboot d'inventaire.

Figure 4 — Arbre de décision du playbook : détection read-only par défaut, application opt-in via GRUB ou grubby selon la famille de distribution, statut explicite plutôt qu'échec silencieux pour les familles non supportées.

Chez AESTECHNO, nous avons constaté que les configurations kernel par défaut livrées avec les BSP Yocto, Ubuntu Core et les images Debian-based activent uniformément CONFIG_CRYPTO_USER_API_AEAD : sur 100 % des BSP que nous avons examinés à la sortie de la divulgation, l'option est compilée. Sur un projet récent de BSP Yocto pour module NVIDIA Jetson Orin NX livré au premier trimestre 2026, nous avons testé l'intégration de la mitigation directement dans la chaîne U-Boot : la variable bootargs accepte le flag sans modification du device tree. Dans notre pratique d'audit kernel, nous accompagnons les équipes ops qui doivent documenter leur exposition pour leur reporting Cyber Résilience Act, et nous recommandons systématiquement de coupler la mitigation à un suivi de configuration GitOps : un détecteur de dérive automatique évite qu'une réinstallation laisse retomber le flag sans alerte.

Audit de votre parc Linux ou produit embarqué ?

Vous gérez une flotte de serveurs Linux ou un produit IoT/edge sous Linux et vous devez documenter votre exposition à CVE-2026-31431 ? Nos ingénieurs vous accompagnent :

Audit de la chaîne de boot et de la configuration kernel sur vos images de production
Adaptation du playbook Ansible à votre orchestrateur (Ansible Tower, Semaphore, Rundeck)
Mise en conformité Cyber Résilience Act (CRA) pour les produits commercialisés en UE

Audit gratuit 30 min

Procédure de roll-out recommandée

Un déploiement sécurité en production est un exercice qui se planifie comme un déploiement applicatif : par vagues, avec rollback explicite, et avec un signal de validation entre deux vagues. La méthode que nous suivons sur les flottes que nous opérons est la suivante.

Inventaire. Lancer la détection en mode read-only sur l'ensemble du parc. La sortie attendue est une liste exhaustive de chaque hôte avec son statut : active, staged, vulnérable, unreachable. Les unreachable sont traités comme vulnérables jusqu'à preuve du contraire.
Canari. Choisir un hôte représentatif, même distribution majoritaire, même rôle applicatif, et y stager la mitigation avec --limit. Redémarrer en fenêtre de maintenance basse activité, valider que les services applicatifs remontent normalement, et que /proc/cmdline contient bien le flag.
Vague de production. Étendre par lots de 10 % à 25 % du parc, en respectant les fenêtres de maintenance définies par les SLA. Les redémarrages restent manuels ou orchestrés par votre outil de gestion de fleet (kured pour Kubernetes, Spacewalk/Foreman pour la famille RHEL).
Validation finale. Re-détecter l'ensemble du parc 48 h après la dernière vague. Tout hôte resté staged sans active trahit un reboot manqué et doit remonter en alerte.

Cette discipline, détecter, stager, redémarrer, re-vérifier, recoupe les principes que nous appliquons dans nos pipelines de DevOps embarqué et CI/CD pour produits industriels : aucun changement de production sans signal de validation explicite.

Figure 5 — Calendrier de roll-out : la fenêtre d'exposition est minimale sur le cloud (24-72h) mais peut atteindre 2-4 semaines sur les segments régulés ou les passerelles industrielles, ce qui justifie la mitigation cmdline en mesure compensatoire.

CVE-2026-31431 dans le contexte du Cyber Résilience Act

Le Cyber Résilience Act (CRA, règlement 2024/2847) est un règlement européen qui impose des obligations de cybersécurité aux fabricants de produits comportant des éléments numériques vendus en UE. Il couvre le traitement des vulnérabilités, le reporting des failles exploitées et la traçabilité des composants logiciels sur tout le cycle de vie du produit.

Pour les fabricants de produits comportant des éléments numériques distribués en UE, CVE-2026-31431 est directement dans le périmètre du Cyber Résilience Act (CRA, règlement 2024/2847). Le règlement CRA, applicable à partir de décembre 2027 selon l'ENISA, exige un reporting des vulnérabilités exploitées sous 24 heures, une politique de Coordinated Vulnerability Disclosure (CVD) alignée sur RFC 9116, et une traçabilité des composants via un Software Bill of Materials (SBOM) au format CycloneDX 1.5 ou SPDX 2.3.

Concrètement, selon ENISA, un produit IoT commercialisé qui embarque un kernel Linux affecté doit être en mesure d'identifier l'exposition via son SBOM, d'émettre une notification au coordinateur national et de proposer une mitigation à ses utilisateurs dans les 24 heures suivant la confirmation d'exploitation active. Le playbook Ansible que nous publions répond à la partie « démontrer la mitigation » de cette obligation : il génère un rapport par hôte que l'on peut joindre à un dossier CRA. Pour les opérateurs de services essentiels couverts par NIS2, l'obligation est analogue avec des seuils de criticité légèrement différents.

Quand retirer la mitigation

La mitigation cmdline est une mesure intermédiaire qui doit être retirée une fois qu'un kernel patché signé par le fournisseur est déployé, vérifié et généralisé sur l'ensemble du parc. Une fois que votre fournisseur de kernel, Canonical pour Ubuntu, Red Hat pour RHEL, le mainteneur de votre BSP Yocto pour les produits embarqués, a publié un kernel patché et que vous avez redémarré dessus, le flag peut être retiré sans risque. Suivez les pages de tracking officielles : Ubuntu, Debian Security Tracker, et les bulletins équivalents Red Hat / SUSE.

Le retrait se fait avec deux one-liners, symétriques de la mitigation :

  # Debian / Ubuntu
  sudo sed -i 's/ initcall_blacklist=algif_aead_init//' /etc/default/grub
  sudo update-grub
  sudo reboot

  # RHEL family
  sudo grubby --update-kernel=ALL --remove-args="initcall_blacklist=algif_aead_init"
  sudo reboot

Pour un parc, automatiser ce retrait dans une seconde passe Ansible une fois le patch kernel déployé évite que le flag ne reste « collé » dans la configuration de boot pendant des années : un cas de dérive de configuration que nous voyons régulièrement sur des serveurs hérités.

Pourquoi nous publions ce playbook

10+ ans de conception de systèmes Linux embarqués industriels
Expertise kernel, BSP Yocto, sécurité produit de la conception au déploiement terrain
Méthodologie secure-by-design alignée sur le Cyber Résilience Act
Bureau d'études français basé à Montpellier, code publié sous licence Beerware

À retenir : un arbre de décision en 90 secondes

La réponse à CVE-2026-31431 est une décision courte en deux temps : appliquer la mitigation cmdline sous quelques heures, puis planifier le kernel patché. Si votre parc fait tourner un kernel Linux 4.x ou 5.x compilé avant le 1er mai 2026, appliquez initcall_blacklist=algif_aead_init sur la cmdline kernel sous quelques heures, et planifiez le déploiement du kernel patché signé fournisseur lors de la prochaine fenêtre de maintenance. Si vous exécutez des conteneurs sur ces hôtes, appliquez la mitigation cmdline sur l'hôte, pas dans le conteneur ; ce seul paramètre ferme la surface pour tous les conteneurs qui tournent au-dessus.

Pour nos clients embarqués, la même logique se traduit par trois actions : éditer /boot/extlinux/extlinux.conf ou l'environnement U-Boot selon le bootloader, pousser via le canal OTA avec rollback activé, et documenter le changement dans le journal de sécurité que le Cyber Résilience Act exige. Nous avons appliqué cette séquence exacte sur des passerelles industrielles de notre portefeuille, et le déploiement tient systématiquement dans une seule fenêtre de maintenance.

FAQ

CVE-2026-31431 affecte-t-elle un serveur dont seul SSH est exposé ?

Oui, dès qu'un compte non root peut s'y connecter. La faille étant une élévation locale de privilèges, le vecteur d'entrée, SSH avec utilisateur restreint, conteneur, application web, runner CI, n'a pas d'importance : ce qui compte est qu'un processus userland puisse ouvrir une socket AF_ALG. Un serveur multi-utilisateur ou multi-tenant doit être considéré comme prioritaire.

Le flag initcall_blacklist dégrade-t-il les performances ?

Non, pour la quasi-totalité des charges de travail. Les bibliothèques crypto userland (OpenSSL, libsodium, GnuTLS) utilisent leurs propres implémentations optimisées AES-NI/AVX2 et n'appellent pas AF_ALG. Seuls quelques outils spécifiques (certains agents cryptsetup avec backend kernel) pourraient être impactés ; ils utilisent en pratique algif_skcipher et algif_hash, qui restent fonctionnels.

Le kernel patché est-il déjà disponible pour ma distribution ?

La fenêtre de publication varie selon les distributions. Suivez en temps réel les pages de tracking : Ubuntu CVE-2026-31431, Debian Security Tracker, ainsi que les bulletins Red Hat et SUSE. La mitigation cmdline reste valide tant que vous n'avez pas redémarré sur un kernel marqué fixed par votre fournisseur.

Le playbook fonctionne-t-il sur ARM (Raspberry Pi, Jetson, passerelles industrielles) ?

Oui. La mitigation porte sur la ligne de commande kernel et sur la chaîne GRUB/grubby ; elle est indépendante de l'architecture CPU. Les images Raspberry Pi OS (Debian) sont gérées par le chemin Debian family du playbook ; les BSP Yocto pour NVIDIA Jetson ou cartes industrielles ARM peuvent utiliser GRUB ou un bootloader custom (U-Boot, extlinux), auquel cas l'édition se fait dans /boot/extlinux/extlinux.conf ou l'environnement U-Boot, adaptable à partir de notre code.

Faut-il appliquer la mitigation et attendre le patch, ou choisir ?

Les deux, dans cet ordre. La mitigation cmdline ferme la surface d'attaque immédiatement, sans dépendre du calendrier de votre fournisseur. Le patch kernel, lui, corrige la cause racine et permet à terme de retirer le flag. Une politique de sécurité produit alignée sur le Cyber Résilience Act exige les deux : une mesure compensatoire documentée pendant la fenêtre d'exposition, suivie du correctif définitif.

Un conteneur Docker non privilégié est-il concerné ?

Oui. Le conteneur partage le kernel de l'hôte, et l'interface AF_ALG n'est pas filtrée par le profil seccomp Docker par défaut. Un attaquant qui compromet un applicatif dans le conteneur peut donc déclencher Copy Fail et obtenir un privilège niveau kernel, qui équivaut à root sur l'hôte si user namespaces n'est pas configuré. La mitigation à appliquer est initcall_blacklist=algif_aead_init sur le cmdline kernel de l'hôte, pas du conteneur ; elle ferme la surface pour tous les conteneurs qui s'exécutent au-dessus.

Crédit découverte : Taeyang Lee (Theori) pour la vulnérabilité, Xint Code Research Team pour la chaîne d'exploitation. Notre playbook automatise la mitigation qu'ils recommandent.