Comment supprimer le spam referrer de vos statistiques? (SPAM Google Analytics)
Lindsay
Korleon'Biz » BLOG KB » Outils SEO » Comment supprimer le spam referrer de vos statistiques? (SPAM Google Analytics)
20 août 2015
Vous avez forcément rencontré dans vos statistiques de site internet des visites venant de sites « improbables ».
Notez que dans cet exemple nous ne considérons pas laurentbourrelly.com comme un spammeur 😉
Ce genre de technique de « marketing » discutable met un joyeux bazar dans vos chiffres et bien sûr fausse allégrement l’intégralité de vos stats en impactant toutes les moyennes comme la durée des visites, le taux de rebonds … etc etc
En attendant que les équipes de Google Analytics nous proposent une solution digne de ce nom pour enrayer ce phénomène, voici quelques façons de se débarrasser de ces indésirables.
Tout d’abord, vous devez comprendre qu’il y a 2 sortes de spam:
- le vrai: des bots viennent et génèrent de « vrais fausses visites » mais sans vrai internautes (Crawler Referral),
- le faux: ce sont des scripts qui déclenchent les scripts analytics donc aucune visite sur votre site (ghost referral)
1er méthode le htaccess: pour le vrai spam referrer
Cette méthode permet d’empêcher des bots de venir sur le site. on les bloque dès l’entrée et on en parle plus !
Efficace bien sur sur le vrai spam, sur le faux cela ne fait strictement rien !
### Start Referral Spam Traffic Ban
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*e\-buyeasy\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*best\-seo\-solution\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ^https?:\/\/([^.]+\.)*buttons\-for\-website\.com [NC,OR]
RewriteRule .* – [F]
### End Referral Spam Traffic Ban
A faire avec la liste des sites qui vous correspondent bien sur 🙂
2ème méthode le filtre Analytics
Attention cette méthode est irréversible ce qui signifie que vous ne verrez plus jamais ce trafic. Donc commencez par créer une vue neutre au cas où vous fassiez une erreur (notez vous que cela devrait être dans la liste des bonnes pratiques Google Analytics)
Admin/ Vue / Créer une vue
Puis créer un nouveau filtre
Pour le regex de la règle de filtrage : la liste des domaines séparées par un |
Exemple : success-seo.com|semalt.com …
Soyez patient, et attendez 24 h avant de voir les premiers résultats filtrés.
3ème méthode : Le segment
Nous avons résolu les problèmes de temps réel, mais il nous restencore toutes les données collectées et faussées par le spam, la solution consite donc à monter un segment afin de les différencier.
Autrement dit cela va être moyennement simple dans vos tableaux mais vous allez récupérer un peu de justesse dans tous vos chiffres.
Ensuite vous affichez uniquement ce segment et vous ne verrez plus le spam. (Le segment à installer directement)
Comme vous pourrez le constatez aucune méthode n’est infaillible, nous sommes donc obligé de patcher comme nous pouvons pour tenter de récupérer des chiffres à peu près cohérents.
Sinon il vous reste la solution de changer de solution de statistiques et de passer chez Yandex Metrica qui est pour le moment épargné par le spam fantôme.
Cadeau : Liste de + de 300 spams identifiés / (source)
Rédigé par: Sandrine Bertrand de Korleon’Biz!
15 Comments
Merci pour cet article et la notion de segment que je ne maîtrise pas.
En outre, j’ai remarqué beaucoup de SPAM en accès direct également … avez-vous une solution pour l’éviter ?
Comment arrivez vous à différencier le spam, des vrais visites, en accès direct ?
Pour ma part, je trouve que la 3e méthode, celle du segment, est de loin la plus efficace. D’une part parce qu’elle permet une rétro-activité, pratique quand même pour comparer les stats avec l’année dernière et surtout parce qu’elle ne demande que 30 sec pour être appliquée à des dizaines de sites, contrairement aux deux premières. Et la mise à jour du segment est également assez rapide puisqu’il ne faut le faire qu’un seule fois.
Par contre effectivement, il faut faire son deuil et ‘accepter’ que les stats non filtrées n’ont plus aucun sens.
Pour ma part, je suis allé me renseigner sur ce site http://www.ohow.co/ (blog en anglais), je trouve les explications très complètes. On y retrouve aussi une autre méthode via l’exclusion des mauvais noms d’hôtes sur GA.
Je n’ai pas encore testé via les segments mais merci pour l’info. Ca peut être un moyen rapide de filtrer tous ces spams lorsqu’on fait un rapport client 🙂
via la liste d’exclusion ce n’est pas une bonne façon de faire car cela déplace le souci des spams du referral vers le direct (google l’explique https://support.google.com/analytics/answer/2795830?hl=en )
C’est peut être ce que rencontre Fred comme direct spam ! non ?
Je pense que je me suis mal exprimé, c’est plutôt l’inclusion des noms d’hôtes valides. Le blogueur l’explique mieux que moi ici : http://www.ohow.co/what-is-referrer-spam-how-stop-it-guide/#How-to-stop-the-Spam-in-Google-Analytics-with-2-filters
Ca c’est intéressant oui ! Je vais me pencher dessus, mais c’est bien possible que je me sois planté … 🙂 En fait, j’ai remarqué, après avoir modifié mon htacess et créé des filtres dans analytics, une forte hausse de trafic direct, ce qui m’a paru assez anormal (même si je ne peux clairement l’identifier).
Merci pour votre retour !
Merci pour cet article.
La meilleure méthode serait que Google se sorte les doigts de l’alphabet et filtre automatiquement. Après tout, il existe une case à cocher pour cela dans la configuration de la vue.
Il existe aussi du spam d’événements et du spam de hostname. Bientôt du spam de variables personnalisées??
Et du spam dans les mots clefs de la recherche organique depuis quelques jours…
Là c’est facile ! Si c’est du « not provided » c’est du vrai si on a un mot clé c’est du spam ! – Pardon c’était trop facile 😉
Ahah, oui c’était facile 😉
plus sérieusement, j’ai sexyali.com dans mes keywords. Bon, on peut encore faire un filtre
Je pense que le mieux c’est de passer chez yandex 🙂
Intéressante la technique pour bloquer dès l’origine en effet. Je vais tester ça rapidement.
J’ajouterais une précision concernant celle avec les filtres Analytics : la taille du filtre est limitée en taille, ce qui est un peu pénible. Obligé de créer plusieurs filtres pour prendre en compte tous ces sites référents de m****
Quant aux segments, avec des volumes de données un peu important, j’ai tellement eu des résultats biaisés en les utilisant que je ne m’en sers plus.
La méthode des segments est sans comparaison ! Plus simple et plus rapide à mettre en place, elle est rétroactive, et ça je trouve que ça n’a pas de prix car ça évite de créer de nouvelles vues et de dire adieu aux comparaisons de trafic entre 2 dates.
La meilleure solution pour éliminer le spam referrer est de supprimer google analytics, et vous pourriez être surpris par les résultats dus à l’effet papillon, si vous voyez ce que je veux dire…..