Le PageRank, premier secrétaire de Google

Quand on pense à Google, on ne pense qu'au site (par exemple google.fr), qui n'est en fait qu'une interface, un employé de guichet, pour faire un parallèle avec le monde physique. Et cet employé est là pour nous fournir les informations demandées en allant regarder dans des registres, correctement étiquetés et préalablement triés.

Google

Google.fr n'est qu'une jolie employée parmi d'autres (source)

D'où viennent les informations ?

Pour indexer l'ensemble du Web, Google, comme tous les autres moteurs de recherche, utilise un robot d'indexation (web crawler), qui explore automatiquement la jungle qu'est Internet pour en indexer le contenu (créer des fiches dans les registres).

Mais juste indexer le contenu ne suffit pas, il faut ensuite trier les données récupérées, car il y a beaucoup de contenu de mauvaise qualité ou pas forcement pertinent.

Qui s'occupe du tri ?

Le tri des données indexées est assuré par plusieurs d'algorithmes, c'est à dire une suite logique d'opérations et instructions permettant de résoudre un problème donné (ici, classer par ordre décroissant de pertinence pour un mot ou une expression une liste de pages web).

PageRank, les origines

PageRank est le nom de l'algorithme à l'origine de tout pour Google. Il date de 1995, l'époque de "BackRub", le projet de recherche universitaire mené par Larry Page et Sergey Brin à l'Université de Stanford, Californie.

Comment ça marche ?

Tout ce que l'on trouve à propos du fonctionnement actuel de PageRank est pure supposition, car il n'a été présenté qu'une seule fois au public, lors de la soutenance finale du projet de recherche. Et depuis, il a été de nombreuses fois modifié afin de pouvoir classer les résultats de manière de plus en plus optimale.

À propos du mode opératoire de PageRank, Google indique qu'il se base sur le nombre et la qualité des liens vers une page pour juger de l'importance d'un site. Mais il est clair que l'algorithme repose sur beaucoup d'autres paramètres, lui permettant un classement plus fin.

Mises à jours animalières

Depuis son lancement, l'algorithme PageRank a reçu plusieurs mises à jour majeures, toutes baptisées du nom d'un animal.

Dans l'ordre chronologique de leur annonce, les mises à jour sont :

  1. Panda, en février 2011
  2. Penguin, en avril 2012
  3. Hummingbird, en septembre 2013
  4. Pigeon, en juillet 2014
PageRank

PageRank, la principale secrétaire de Google (source)

Sources : Google [1][2] et Wikipédia [1][2]

Retour vers la liste des pages traitant de référencement sur les moteurs de recherche.