Yandex leaks & SEO : ce qu’il faut savoir

Par

Rémi Kerhoas

Le concurrent russe de Google, Yandex, a été victime d’un vol de données décrivant de manière relativement précise les (1 992 !) critères de classement des pages Web.

Retour sur un sacré fait d’hiver dans le monde du SEO :

Yandex leaks : que s’est-il passé exactement ?

Pour ceux qui ne sont pas familiers avec Yandex, c’est 54% du marché des moteurs de recherche en Russie (donc devant Google qui est à 44%). Source : Statcounter. Donc on ne parle pas d’un petit “leak” !

A priori, il s’agirait d’un ancien employé de Yandex. Celui-ci aurait mis en ligne le code source de l’entreprise (~45GB tout de même) datant de juillet 2022 et qui ferait référence à plusieurs produits dont :

  • Le moteur de recherche Yandex
  • Yandex Metrika (le concurrent de Google Analytics)
  • Yandex Maps (le concurrent de Google Maps)
  • Yandex Taxi (le concurrent d’Uber)
  • Yandex Mail (Gmail)
  • Et plus encore !

Bref, il y a beaucoup de points intéressants dans ces fichiers… au moins pour valider ses connaissances SEO ! Et comme la base de ces “leaks” semble tout à fait valide et concordent bien avec une vision Ads / Analytics... 🙂

C’est parti :

Yandex leaks : des révélations ou de simples confirmations ?

A noter, Yandex n’est pas Google (et vice versa). Donc il ne faut pas copier coller ce que vous trouverez dans ces données pour votre compréhension du SEO chez Google. Mais je ne pense pas trop m’avancer en disant que les grandes lignes sont (très) similaires.

Ceci étant dit, voici les points permettant de booster son SEO que j’ai retenu :

Le taux de clic dans les SERPs de Yandex

Avoir un bon copywriting et des balises meta bien remplies a de l’importance.

Les backlinks (leur âge, pertinence, etc.)

Être vu comme un site autoritaire dans son domaine au point que d’autres sites pertinents sur le sujet vous envoient du trafic.

Les mots-clés (sur la page, dans l’URL, les titres, etc.)

Mettre en avant un contenu sémantiquement proche de celui recherché par les utilisateurs du moteur de recherche.

Les performances comportementales

Il s’agit là du taux de rebond, du nombre de pages vues, du volume de pages par session, etc. et notamment si le site possède… Yandex Metrika !

Le volume de pages avec erreurs 400 / 500

Vérifier que le site est facilement crawlable par les bots de Yandex.

Avoir du trafic provenant de… Yandex Ads !

Celle-ci c’est cadeau ! 😜

Beaucoup de choses intéressantes donc mais, finalement, rien de bien nouveau. Le SEO est depuis longtemps basé (grosso modo) sur le triptyque technique, contenu et backlinks. Ce que l’on retrouve dans ces données.

Donc pas vraiment de révélations... n'est-ce pas ?

Le SEA aide le SEO : vrai ou faux ?

Attention, ce qui suit est moins factuel… et plus de l’interprétation. A prendre avec des pincettes donc 🙂

Dans les données “leakées”, il n’y a pas d’indications disant comment (ou combien) le SEA sur Yandex Ads aide le SEO sur Yandex. Donc il n’y a pas de quoi s’alarmer et crier à la conspiration “il faut payer pour ranker en SEO”.

Ceci dit, si l’on tente une approche “reverse engineering”, on comprend qu’avoir du trafic SEA permet de nourrir les algorithmes des moteurs de recherche. Car avec ces données, couplées à celles fournies par Yandex Metrika, Yandex se retrouve alors en possession d’une meilleure image des performances de tel ou tel site.

Bref, en théorie, si le contenu est intéressant, les utilisateurs devraient :

  • Rester sur les pages (faible taux de rebond)
  • Consommer le-dit contenu (rester sur la page relativement longtemps)
  • Consommer d’autres contenus (voir d'autres pages)
  • Revenir (# d’utilisateurs bien inférieur au # de sessions)
  • Etc.

On retrouve donc les performances comportementales telles que décrites depuis longtemps dans… Google Analytics ! Et s’il y a bien une théorie à laquelle d’adhère, c’est qu’avoir Google Analytics sur son site aide au SEO. Car à minima, on a une vue très claire sur des critères de ranking de Google. Tout comme Yandex.

Conclusion : penser utilisateurs, pas moteur de recherche

Ce que ce leak nous apprend, c’est surtout que le reverse engineering du SEO a sans doute déjà trouvé les formules magiques permettant de bien ranker. Et celles-ci n’ont rien d’immédiat.

Il y aura sans doute quelques SEO “black hat” pour utiliser telle ou telle faille pendant quelques temps (avant de se faire pincer et de voir leur PageRank chuter à 0) mais, en règle générale, il faudra s’armer de patience et fournir de la valeur à sa cible marketing. Ce que l’on tente de faire ici 🙂

Les dernières actus

Le blog

Search Engine Advertising

Est-t-il légal de se positionner sur la marque d’un concurrent sur Google Ads ?

Programmatique

La guerre du streaming : après Microsoft et Netflix, Google noue un partenariat avec Disney+

Search Engine Advertising

Opinion : quand l'IA prime sur la clarté, les annonceurs doivent s'interroger