Les déploiements ultra-denses de la 5G et au-delà font peser une charge importante sur les réseaux cellulaires, en particulier pour les liaisons de retour sans fil. Aujourd’hui, une planification minutieuse de la liaison sans fil est plus importante que jamais. Dans cette lettre, nous étudions le problème de la conception d’une topologie de liaison sans fil hiérarchique. Nous introduisons un algorithme basé sur l’apprentissage par renforcement profond (DRL) qui peut résoudre le problème efficacement. Nous comparons la qualité des solutions dérivées par notre approche DRL à la solution optimale, dérivée selon la formulation du programme linéaire en nombres entiers (ILP) dans notre travail précédent. Une simulation utilisant des scénarios pratiques de propagation des canaux et différentes densités de réseau prouve que notre algorithme basé sur le DRL fournit une solution sous-optimale avec différents niveaux de résilience. Notre algorithme DRL s’adapte également à de plus grandes instances du problème.