Les brouilleurs réactifs, qui commencent à attaquer dès qu’ils détectent des transmissions légitimes, constituent une menace sérieuse pour les communications sans fil. Les méthodes conventionnelles de lutte contre le brouillage, telles que les systèmes de lutte contre le brouillage basés sur le saut de fréquence, ne sont pas efficaces contre les brouilleurs réactifs, en particulier les brouilleurs agiles qui brouillent immédiatement après avoir détecté des transmissions. Les méthodes anti-brouillage basées sur la tromperie ont un grand potentiel pour exploiter les brouilleurs réactifs et sécuriser les canaux de communication pour les utilisateurs légitimes. Toutefois, dans les méthodes anti-brouillage basées sur la tromperie, il est difficile d’atteindre la puissance optimale et l’attribution des canaux en raison de l’indisponibilité des informations sur les canaux des brouilleurs. Dans cet article, nous proposons des schémas anti-brouillage basés sur la tromperie pour lutter contre les brouilleurs réactifs en utilisant l’apprentissage par renforcement. En outre, nous considérons les deux cas où un brouilleur réactif peut brouiller un canal ou tous les canaux utilisés par des utilisateurs légitimes. Dans ce dernier cas, nous modélisons l’interaction entre les utilisateurs et le brouilleur comme un jeu de Stackelberg non coopératif et prouvons l’équilibre. En outre, nous étudions différents scénarios dans lesquels l’environnement d’interaction est statique ou dynamique en termes de gains de canaux. Les résultats de la simulation montrent que dans des environnements statiques, les méthodes proposées atteignent les valeurs optimales de la puissance totale reçue et du rapport signal-brouillage-plus-bruit avec une précision de 95 %. En outre, dans des environnements dynamiques, les méthodes proposées offrent des performances élevées en termes de paramètres d’évaluation considérés.