La protection d’un grand nombre de liaisons de communication sans fil contre l’interception de l’ennemi dans les systèmes WIN-T (Warfighter Information Network-Tactical) est un défi. En raison de la grande mobilité des véhicules de combat terrestres (GCV), la capacité de faible probabilité d’interception (LPI) peut facilement être violée. Les travaux antérieurs se concentrent principalement sur une seule technique d’interception, ce qui expose les vulnérabilités lorsque plusieurs techniques d’interception sont déployées simultanément. Nous proposons une stratégie contre les techniques d’interception basées sur l’énergie et la corrélation en optimisant conjointement l’allocation de puissance (PA) et l’assignation du facteur d’étalement (SA) du WIN-T. Ce problème non convexe est ensuite résolu par des techniques d’optimisation avancées telles que la décomposition et la différence de fonctions convexes (DC). Nous proposons également une stratégie de sélection du mode de communication pour améliorer les performances de débit dans le contexte de la conservation de l’IPV. Pour obtenir la solution optimisée en temps quasi réel, nous concevons un algorithme d’apprentissage par renforcement profond multi-agents (MADRL). Nos résultats numériques montrent que la performance de l’algorithme MADRL proposé est proche de la solution optimale, ce qui le rend applicable à des systèmes pratiques.