Depuis que je travaille sur le web, certaines pages de résultats restent encore et toujours complètement non pertinentes et font remonter du spam

Sac contrefaçon Vuitton

Ce sont toujours les mêmes requêtes qui sont concernées (les contrefaçons) :

Avec toutes les mises à jour Pingouin et Panda, on peut s’interroger sur la politique antispam de Google.

En lisant un très bon article de Nicolas Augé, j’ai eu envie de me pencher plus en profondeur sur les faiblesses de Google :

http://www.nicolasauge.com/spam-hack-levier-marketing-risque/

Le pingouin n’est peut-être pas si doué que ça :

pingouin fail

La mécanique de SPAM utilisée est assez simple :

1. Création d’une jolie boutique sur un domaine tout neuf.

Le but de ce domaine n’étant pas d’être positionné mais de récupérer le trafic des domaines spammés et de vendre des contrefaçons ou même de juste récupérer les infos bancaires des internautes.

2. Utilisation de failles techniques pour ajouter des pages sur des sites existants sur internet. (C’est du piratage informatique et c’est illégal).

3. Sur les sites piratés, les pages ajoutées utilisent du cloaking sur UserAgent. L’internaute est redirigé en 302 ou en Meta Refresh vers la jolie boutique, et les moteurs de recherche affiche une page de contenu sur-optimisée.

4. Une quantité énorme de liens est créée via des techniques automatisées (pingback, com de blog, forum…)

5. En conclusion, le site piraté se positionne dans les tops résultats et renvoie les internautes sur la jolie boutique de contrefaçon.



Si vous n’avez pas suivi, voila ce que ca donne concrètement :

1. Le site http://www.ilongchampsoldes.com/ est créé.

2. Le site http://www.ybgraphic.fr/ est hacké.

3. La page http://www.ybgraphic.fr/sac-longchamp-pas-cher/ est ajoutée.

Avec une redirection pour l’internaute

Et avec du contenu automatique pour les moteurs (voir ici)

4. Des milliers de liens sont créés automatiquement :

spam liens

5. Et la page http://www.ybgraphic.fr/sac-longchamp-pas-cher/ finit en 3ème position sur « longchamp pas cher »



Je m’interroge toujours sur plusieurs points :

  • Google n’était pas censé détecter le cloacking sur UserAgent ?
  • La protection des Marques (ChillingEffects) ne sert à rien ?
  • Le filtre Panda n’est pas censé empêcher le positionnement des contenus automatisés ?
  • Google Pingouin ne filtre pas rapidement les profiles de liens ultra-spammy ?

Pour le cloacking, j’ai clairement la réponse Google ne le vérifie pas… jamais. J’ai un vieux site bourré de cloacking pour des tests en SEO, le site n’a jamais été inquiété.

La seule façon d’être pénalisé pour du cloacking, c’est que quelqu’un utilise le spam-report et que des mois plus tard le « service qualité » intervienne.

Bateau pirate Google

Pour la protection de marque, ça ne sert à rien car Google désindexe les jolies boutiques de contrefaçon mais pas les sites qui leur envoient le trafic via des redirections.

D’ailleurs c’est un jeu sans fin, vous coupez un site et deux autres repoussent aussitôt. Longchamp a déjà fait supprimer plus de 12000 domaines :

https://www.chillingeffects.org/faceted_search?sender_name=SAS+Longchamp

En combien de temps, Google va réagir si on spamme complètement sur une page ?

En analysant la vitesse de création des sites spammés et la durée des positionnements, j’ai remarqué que les sites réalisaient un roulement tous les 3 mois à 4 mois.

Exemple pour les sites positionnés sur « longchamp pas cher » :

  • En Octobre 2013, une première fournée de sites, exemple : http://jaunay-clan.fr/
  • En Mars 2014, une seconde fournée de sites, exemple : http://chansonfrancaise70.fr/
  • En Juin 2014, une troisième fournée de sites, exemple : http://prieurdessources.fr/
  • En Septembre 2014, une quatrième fournée de sites, exemple : http://www.ybgraphic.fr/

Cependant, c’est rarement à cause de Google (Pingouin ou Panda) que les sites perdent leur positionnement, c’est souvent les Webmasters qui finissent par se rendre compte que leur site est piraté. Et ils coupent les pages bien référencées…

Par exemple, le site http://www.prieurdessources.fr/ est resté en 1er position sur « Longchamp pas cher » de Juin à Septembre, avant que le Webmaster ne nettoie son site.

Pingouin à la plage

Et si personne n’intervient, le positionnement peut tenir longtemps…

Le site www.escem.org s’est fait piraté en Avril 2014 et a été référencé avec 125 000 liens entrants :

Referring BL


Le site est toujours 2ème sur « air max pas cher » plus de 6 mois après.

Alors que le profil de liens est complètement alarmant :

  • 3000 domaines référents créés en 2 semaines
  • 74% des ancres sont « Longchamp pas cher »
  • 97% de Dofollow
  • des liens depuis des sites complètement spammés et non thématiques (http://www.mathieuberthet.com/?p=107)

En conclusion, les filtres Pingouin et Panda ne sont clairement pas assez rapides.

Un site a largement le temps de se positionner grâce au spam en partant de zéro, et il peut tenir plusieurs mois avec d’excellentes positions.

La pénalisation ne viendra en moyenne que 4 à 8 mois plus tard.