wordfence wordfence_lh
wordfence wordfence_lh

Wordfence gonfle votre site Web et génère des tonnes d'URLs ?

Wordfence génère automatiquement des tonnes de pages vierges sur votre site WordPress ? Ce qui entraîne de nombreuses pages « explorées non indexées »? Et des avertissements dans GSC ?

Découvrez comment empêcher Wordfence de créer des URLs. Grâce à l'excellent article de Matt Tutt dont cet article est une traduction avec quelques adaptations.

Google Search Console indexe les URL wordfence_lh de Wordfence

Il y a quelque chose de bizarre pour certains de mes sites web ajoutés dans Google Search Console. En effet j'ai remarqué une récente augmentation des erreurs « Exploré – actuellement non indexé » dans la Google Search Console.

Notez que je parlerai de GSC dans la suite de cet article wordfence_lh pour parler de la Google Search Console.

En examinant ce problème de manière un peu plus approfondie. .... Ceci est à priori causé par le "LIVE TRAFFIC " du plugin de sécurité Wordfence pour WordPress.

Une fois de plus je rencontre un bug avec Wordfence. Alors je commence à me demander si cela vaut le coup de le garder comme plugin de sécurité ? Toutefois j'aimerais comprendre pourquoi cela se produit. Et surtout comment empêcher que cela continue.

Comment désactiver Live Traffic par Wordfence - 2 options

En réalité c'est assez facile de désactiver ou de modifier cette fonctionnalité. Cela permettra d'économiser les ressources du serveur. Et surtout cela évitera le problème de génération de pages blanches de Wordfence !  Sans pour autant sacrifier la sécurité de votre site Web bien entendu.

En fait il y a 2 (voire 3) options qui s'offrent à nous ici :

A\ Soit nous pouvons réduire la consommation des ressources liés à cette fonctionnalité. En limitant Wordfence à la vérification du trafic lié à la sécurité. Plutôt qu'à la vérification de tout le trafic.

B\ Soit nous pouvons essayer de désactiver complètement cette fonctionnalité.

C\ Soit on peut faire les deux.

Option 1 : modifier les options du plugin Wordfence

Étape 1  : wordence -> all options

Connectez-vous simplement au tableau de bord WordPress du site concerné. Survolez l'élément Wordfence. Et sélectionnez "Toutes les options". Comme sur cette copie d'écran :

Comment désactiver Live Traffic par Wordfence
Comment désactiver Live Traffic par Wordfence ?

 

Étape 2  : live traffic > security only

Faites défiler vers le bas de la page. Et ouvrez l’élément Options de "trafic en direct" ou "live trafic" en anglais. Comme sur cette copie d'écran :

Google Search Console indexant les URL wordfence_lh
Google Search Console indexe les URL wordfence_lh.

 

Basculez vers Sécurité uniquement comme mode d'enregistrement du trafic. Puis modifiez la quantité de données de trafic à stocker sur une plage plus raisonnable. J'ai choisi 100 nombre de lignes. Et réduisez le nombre maximum de jours pour conserver les données de trafic en direct. J'ai choisi 1.

Apparemment il existait auparavant une option permettant de désactiver complètement la fonctionnalité Live Traffic. Mais dans la version de Wordfence que je possède cela ne semble pas possible. Je suis sur le forfait gratuit.

Assurez-vous de cliquer sur « Enregistrer les modifications », sinon toutes vos modifications seront perdues !

Option 2 : désactiver le trafic en direct (ou live traffic) dans wp-config.php

De toute évidence, c'était plus difficile à trouver que je ne l'avais espéré.  De fait, il existe une section d'aide avancée sur le site Web de Wordfence. Pour résumer, ils expliquent comment désactiver la fonctionnalité de Live traffic. Et ceci en modifiant le fichier wp-config.php.

La fonctionnalité Live Traffic peut être désactivée soit sur la page de l'outil "Live Traffic". Ou sur la page "Toutes les options". En définissant le mode d'enregistrement du trafic sur SÉCURITÉ UNIQUEMENT. Cependant, si vous devez empêcher d'autres administrateurs de l'activer, vous pouvez définir cette constante. Cela peut être utile pour les développeurs dont les clients utilisent des hôtes lents. Ou si le client dispose d'un compte administrateur et peut activer Live Traffic.

Si vous maîtrisez l'accès FTP, vous pouvez généralement trouver le fichier wp-config.php. Il est à la racine du dossier Public HTML de votre site Web. Là où WordPress a été installé.

Étape 1 : ouvrir le logiciel FTP

Ouvrez votre logiciel FTP. Puis accédez à la racine de l'installation WordPress sur le site Web concerné. Comme sur cette copie d'écran :

Accéder au fichier wp-config.php via SFTP
Accéder au fichier wp-config.php via SFTP.

 

Étape 2  : modifier le wp-config.php

Ensuite faites une copie du fichier avant de commencer à apporter des modifications. Ceci afin d'avoir une version de secours. Puis avec le fichier original vous pourrez ajouter la ligne de code requise :

define ('WORDFENCE_DISABLE_LIVE_TRAFFIC', true);

Assurez-vous simplement de l'ajouter avant cette ligne :

/* C'est tout, ne touchez pas à ce qui suit ! Bon blogging ! */

 

Étape 3 : enregistrer et télécharger

Re-téléchargez le wp-config.php. Et croisez les doigts pendant que vous actualisez la page :). En espérant ne pas avoir mis votre site hors ligne 🙏.

Bien sûr, il ne sera pas rapide de savoir si le problème est résolu. En effet vous devrez peut-être attendre quelques semaines pour voir si GSC rejette toujours ces URL de page Wordfence.

Modification du fichier Robots.txt pour empêcher l'exploration

On suggère de modifier le fichier robots.txt. Ceci afin d'empêcher les robots d'exploration d'accéder à ces URLs avec paramètres.

John Mueller de Google a également confirmé qu'il est peu probable que cela cause des problèmes de référencement.

We don't do anything special for wordfence. URLs are URLs :-). If they lead nowhere, we sometimes learn and ignore them (but sometimes it takes long). Easiest is just blocking via robots.txt, eg
disallow: /*?parameter=
I doubt they would cause problems though, even crawled.

— 🐐 John 🐐 (@JohnMu) March 25, 2022

Mat Tutt a demandé à John Mueller comment Googlebot pourrait trouver ces URL ? Effectivement impossible de trouver dans le code ou des les Sitemaps ces URLs.  John Mueller suggère ce qui suit :

Well, we wouldn't make them up :-). If they're used for live traffic stats, then I imagine they're dropped as an embed on the pages. You'd probably see them if you looked at the network tab in Chrome dev tools while loading a page like that.

— 🐐 John 🐐 (@JohnMu) March 25, 2022

Pour ma part, j'ai fait les 2 options. Depuis la modification du fichier WP-config.php de mon site : une seule URL est signalée dans le rapport "exploré, non indexé". Sur une période d'environ 3 semaines. Donc je pense que le travail a été fait.

Toutefois j'ai maintenant plein d'erreur 410 dans la GSC. En effet, j'avais essayé ensuite de mettre ces pages en code d'erreur 410 avec mon .htaccess. Finalement cela a bien fonctionné : j'ai maintenant plein d'erreurs 410 dans la GSC :). Et après je ne sais pas .. faut il les bloquer avec le robots.txt ? Ou bien attendre la suppression par google ? Je vais enlever cette redirection 410. Puis attendre à nouveau. Je ne vais pas modifier le robots.txt. ...  Puis je vous dirai.


 

Pourquoi ces pages Wordfence sont-elles un problème ?

Lorsque j'ouvre la Search Console, je consulte souvent le rapport "Problèmes de couverture". Je vois une augmentation significative du nombre de pages exclue par la balise "noindex".

(D’ailleurs, je préfère ne pas signaler un nombre relativement important d'autres erreurs 🙂 - je veux réduire le bruit ! Et n'avoir que le choses importantes visibles à traiter!)

S'agit-il d'un problème de référencement ?

En réalité ce problème de Wordfence semble être un peu un non-problème. Mais il pourrait facilement masquer des problèmes réels enfouis dans le rapport du GSC. En effet, si j'ai bien tout compris .... Le problème est que ce bug Wordfence me prend tout le budget crawl au lieu de crawler mes vraies pages.

Deuxièmement en tant que développeur, je souhaite me simplifier le travail.  Je voudrais donc que ces problèmes liés à Wordfence disparaissent.

Quel est le problème avec Wordfence et ces URL ?

Juste pour clarifier, je ne suis pas à 100 % un référenceur. Et tout ce qui suit sera basé sur mes propres recherches. C'est-à-dire une recherche sur Google pour résoudre le problème de Wordfence.

Finalement, j'écris cet article en espérant que :

  1. cela me motivera à résoudre ce problème persistant une fois pour toutes (j'espère),
  2. et cela devrait aider à accélérer le temps qu'il faut aux autres pour résoudre ce même problème.

Google Search Console indexe les URL wordfence_lh

Sur WordPress les URL des pages générées automatiquement par Wordfence prennent le format suivant :

https://domain.com/?wordfence_1h=1&hid=JF352D0F65FFF754A5B546157CC272E4

Il s'agit d'une URL basée sur des paramètres. Et la page est complètement vide.

À toutes fins utiles cette page ne devrait jamais vraiment se générer. Et encore moins s'indexer dans google.

Que se passe-t-il si vous avez un très grand site (plus d'un million d'URL) ? Cela signifie-t-il qu'il pourrait y avoir des dizaines de millions d'URL générées par Wordfence ? Je ne sais pas. Mais je sais que mon site se compose de 10 pages assez maigres. .. Et il compte désormais plus de 400 de ces pages Wordfence !.

Bien sûr je me concentre sur la diffusion d'un nouveau contenu de qualité. Donc je veux vraiment m'assurer de donner à Googlebot le meilleur contenu possible. Et non des tonnes de pages vides à parcourir inutilement.

Pourquoi Wordfence génère-t-il ces pages blanches ?

Parce qu'ils aiment nous garder sur nos gardes ! (peut être?)

Ainsi, les URL de la chaîne de requête Wordfence sont en fait utilisées par l'outil Live Traffic.
Il s'agit d'un outil pour vous montrer ce qui se passe sur votre site en temps réel. Sur le site Wordfence :

Wordfence enregistre votre trafic au niveau du serveur. Ce qui signifie qu'il inclut des données que d'autres comme Google Analytics ne vous montrent pas. À titre d'exemple, Live Traffic vous montre les visites des robots d'exploration de Google. Mais aussi les robots d'exploration de Bing. Ainsi que les tentatives de piratage. Et bien sûr d'autres visites qui n'exécutez pas JavaScript.

Tiré du site Web Wordfence.

Y a-t-il des problèmes de référencement causés par les URL de la page Wordfence ?

Il existe également des rapports faisant état de ces pages Wordfence 301 redirigeant vers la page d'accueil du site. Comme une sorte de correctif par les développeurs de thèmes. Ce qui peut également être problématique.

wordfence_lh en 301 bonne ou mauvaise idée ?

Quelques utilisateurs sur internet signalent que Google indexe en fait les URL de ces pages Wordfence. Mais cela est probablement dû à un problème de thème personnalisé. Dans lequel au lieu de proposer une page vierge il charge la page d'accueil du site Web. Ou bien encore il redirige vers la page d'accueil. Pour Googlebot cela ressemblait parfois à un véritable contenu à indexer au lieu d'une page blanche.

Quoiqu'il en soit, mon approche générale du référencement consiste à faciliter la vie de Google. Et à le traiter comme un idiot (désolé, Googlebot). Je préfère donc éviter de leur donner des pages inutiles à traiter 🤖.

Que faire si il s'agit d'un problème lié au thème ?

On recommande aux personnes rencontrant ce problème d'essayer de revenir à un thème Wordress par défaut. Par exemple Twenty Twenty. Et de vider leurs caches. Ou de parler à leurs développeurs de thème !. L'un des membres de l'équipe Wordfence a expliqué dans un message sur le forum :

"…Sometimes themes use the WordPress template redirect hook incorrectly. Which results in all requests with a query string end up serving the full contents of the page.".

Wordfence plugin support team.

En résumé, si cela se produisait sur l'un de mes sites et que Google les indexait .... Alors oui ce sera un problème de référencement à résoudre. Dans tous les cas, ces URLs doivent rester des pages blanches. Surtout pas une redirection vers l'accueil ou une autre page.

En fait le principal inconvénient est que cela rend plus difficile l'analyse des rapports de la Search Console.

 


wordfence_lh en conclusion

A l'heure actuelle,  j'ai un site Web qui contient du nouveau contenu assez récent sous la forme d'articles de blog. Il me semble que Google semble l'ignorer :  "Explorée non indexée". Mais il n'est pas facile pour moi de voir l'étendue de ce problème d'un seul coup d'œil. Car il signale toutes ces URL Wordfence non pertinentes. Alors je commence à avoir quelques doutes sur Wordfence.

Et vous utilisez-vous Wordfence comme système de sécurité ? Ou une autre extension ? 

Avez vous d'autres solutions pour ce problème d'url Wordfence ?

Cet article a 3 commentaires

  1. laurent

    Bonjour
    J'ai ce probleme avec worfence qui a généré plus de 200 page prisent en compte par google dans la search console. J'ai supprimer le plugin mais google refuse de corrige le probleme .. comment enlever ces pages ?

  2. WASI

    Bonjour Laurent,

    Pour l’instant je n’en suis pas encore là : j’ai fait les modifications ci-dessus tout en gardant Wordfence. Je vérifie sur la google search console et la génération de ces pages c’est bien arrêté. Je pense que je vais essayer de les supprimer via l’outil « suppressions » dans la google search console. Dans le menu de la GSC à droite, sous indexation, il a suppression. Avez vous essayé ? Comme il y a des paramètres dans l’URL j’imagine qu’il va falloir ruser pour y arriver ! Dites moi si vous trouvez la bonne formule, je l’ajouterai dans l’article.

    J’hésite encore à supprimer Wordfence…. quel plugin de sécurité avez vous choisi à la place du plugin Wordfence ?

    Bonne journée
    Gaby

  3. laurent

    Alors ,j'ai remplacé wordfence par le plugin Security optimizer, et pour supprimer ces pages generer par wordfence , je ne sais pas trop comment faire , j'en ai plus de 200 et sur la page suppression de la google search console c'est une suppression temporaire ....En plus toutes ces pages redirige vers ma page d'accueil, cela ne doit pas etre trés bon pour le referencement

Laisser un commentaire