Un nouvel algorithme distribué d’apprentissage par renforcement multi-agents contre les attaques de brouillage

Un nouvel algorithme distribué d’apprentissage par renforcement multi-agents contre les attaques de brouillage

I. Elleuch, A. Pourranjbar et G. Kaddoum, “A Novel Distributed Multi-Agent Reinforcement Learning Algorithm Against Jamming Attacks,” in IEEE Communications Letters, vol. 25, no. 10, pp. 3204-3208, Oct. 2021, doi : 10.1109/LCOMM.2021.3097290

Abstract or Summary

Dans un réseau sans fil multi-utilisateurs soumis à des attaques de brouillage, les utilisateurs intéressés qui tentent d’apprendre leur meilleure stratégie anti-brouillage se heurtent à un problème majeur, celui des interférences. Une solution intéressante consiste à ce que les utilisateurs apprennent les techniques anti-brouillage de manière coopérative, ce qui peut être réalisé à l’aide d’un algorithme d’apprentissage distribué. Dans ce contexte, les travaux proposant des algorithmes d’apprentissage distribués pour surmonter le brouillage dans les applications multi-utilisateurs reposent sur la disponibilité d’un lien de communication sûr pour l’échange d’informations entre les utilisateurs. Toutefois, si cette liaison de communication est sans fil, il ne serait pas exact de supposer qu’elle est à l’abri des attaques par brouillage. Par conséquent, nous proposons un nouvel algorithme distribué d’apprentissage par renforcement multi-agents pour l’anti-brouillage, à savoir l’apprentissage Q de vérification croisée, dans lequel les utilisateurs établissent des estimations des politiques de prise de décision des autres et s’y adaptent, éliminant ainsi le besoin de communiquer. Lorsqu’il est appliqué contre des brouilleurs à balayage et des brouilleurs intelligents, notre algorithme permet aux utilisateurs de mieux comprendre leur environnement et les aide à connaître la politique de l’attaquant et à éviter efficacement les interférences mutuelles. Les taux de transmission et les niveaux d’interférence de la méthode proposée sont comparés à l’apprentissage Q standard, à l’algorithme multi-agents collaboratif et à la politique aléatoire. Les résultats de la simulation montrent que notre algorithme améliore les taux de transmission des utilisateurs, élimine les interférences mutuelles et présente la vitesse de convergence la plus élevée pour les deux attaques de brouillage considérées.

Implications of the Research

Visuals

Supplementary Materials

Acknowledgements

Citations and References

Other Publications

Retour au haut Drag