En raison de leur nature ouverte et partagée, les réseaux sans fil sont sensibles aux attaques par brouillage. Les efforts de collaboration entre les utilisateurs légitimes sont étudiés pour améliorer la résilience et la sécurité des réseaux. Les algorithmes d’apprentissage distribués et les techniques d’apprentissage par renforcement profond favorisent une coopération efficace et l’optimisation des ressources, ce qui renforce les performances du réseau. Nous présentons “Deep Cross Check Q-learning”, un algorithme d’apprentissage par renforcement distribué et multi-agents modifié en réponse aux attaques persistantes des réseaux sans fil. Les utilisateurs légitimes s’appuient sur les observations du comportement de leurs pairs pour prendre des décisions éclairées, en tenant compte de leur Q-Network profond et des actions de leurs pairs. Notre méthode démontre une efficacité significative contre les attaques de brouillage réactives et basées sur l’apprentissage profond, ce qui permet d’améliorer les rapports signal/bruit et de réduire les interférences mutuelles.