Le fonctionnement des moteurs de recherche.
Ecrit par: SEO
Nombre de lectures: 1788
Nombre de mots: 756
Qu’est ce qu’un moteur de recherche et comment ça fonctionne?
Il existe essentiellement quatre éléments qui interviennent dans le fonctionnement d’un grand moteur de recherche : le robot, l'annuaire, les liens sponsorisés, et l’outil de recherche lui même.
Les robots (par exemple Googlebot) visitent automatiquement des pages Web pour les compiler dans leurs serveurs de données. Les robots suivent les liens d'un site Web à l'autre pour finalement compiler un index de toutes les pages disponibles sur internet.
Les pages archivées dans cet index seront affichées en fonctions des recherches faites par les internautes.
Certains moteurs de recherche disposent de leur propre robot qui alimente leur index alors que d’autres achètent ou louent les résultats des premiers.
Les annuaires quant à eux ne sont pas gérés par les robots mais par des éditeurs humains.
Les éditeurs de l’annuaire ouvert DMOZ passent en revue les sites soumis et vérifient qu’ils répondent bien aux critères de qualité avant de les inclure dans l’annuaire.
Quand votre site est accepté dans l’annuaire, généralement seule une page (habituellement votre page d’accueil - ou index) est indexée.
Les résultats de recherche sont combinés avec des résultats sponsorisés, fournis par les annonceurs (PPC), et les résultats à partir d’annuaires pour compléter l'index du moteur de recherche.
Comment les moteurs trouvent ils les pages web, et comment les classent ils ?
Quand un internaute fait une requête sur un moteur de recherche, les résultats fournis ne sont pas issus du web directement. Ils vont chercher les résultats dans une base de données appelée index qui contient l’intégralité des pages qu'elle-même a tiré des milliards de pages trouvées sur le Web.
Les bases de données des moteurs de recherche sont régulièrement alimentées par les robots qui parcourent la toile sans arrêt.
Quand une page Web n'a aucun qui pointe vers elle, les robots ne peuvent pas la trouver, à moins qu’elle ne soit soumise manuellement par un humain à la page « ajouter URL » du moteur .
Lorsque les robots trouvent vos pages, elles les transmettent à un autre programme pour leur « indexation ». Ce programme emploie un algorithme pour évaluer le texte, les liens, et tout autre contenu dans la page pour les « mots clés » qui pourraient être recherchés sur le moteur. Ceci permet au moteur de proposer des résultats choisis par leur « pertinence » avec les termes de recherche utilisés.
Chaque moteur de recherche utilise ses propres algorithmes de classement.
Certaines pages et liens sont exclus de la plupart des moteurs de recherche parce que leurs propriétaires utilisent des pratiques interdites. D'autres pages ne sont pas incluses dans les index des moteurs parce que les robots ne peuvent pas accéder au contenu des pages. Généralement, l'utilisation de frames (cadres), d’animation en flash constituent un frein à l’indexation de vos pages.
Les sites dynamiques génèrent des pages virtuelles en fonction de critères variables.
Même si les moteurs améliorent leur capacité d’indexation des pages dynamiques, il subsiste une certaine résistance de leur part : lenteur à prendre en compte de nouvelles pages, blocage au-delà de 1 ou 2 variables, blocage sur certaines variables...
La technique de réécriture d’url ou url rewriting permet de transformer une page dynamique en page statique.
En plus de l’indexation des pages, la plupart des algorithmes cherchent à établir la « notoriété » d'un site. Ils présument qu'un site dont les baclinks proviennent d’une page qui contient le mot clé contenu dans le titre de la page et ou dans l’ancre du lien (anchor text) a une plus grande notoriété. Elle sera favorisée dans le classement par rapport à une page dont les liens ou les pages où figure le lien ne contiennent pas le mot clé.
Combien existe il de moteurs de recherche et quels sont les plus populaires ?
Google, Yahoo et Msn sont les 3 principaux moteurs de recherche qui captent la quasi-totalité des recherches mondiales. Pour les recherches faites en langue française, Google reste le leader avec plus de 75 % des requêtes faites sur son moteur, suivi par Yahoo (10 %) et MSN (5%). Il existe d’autres moteurs tels que Altavista, Lycos, ou Exalead qui drainent un trafic beaucoup moins important.
Maintenant que vous comprenez un peu mieux le marché de la recherche et le fonctionnement des moteurs, vous mesurez l’importance que donnent les webmasters francophones à Google.
Un classement de vos pages dans le top-10 de Google pour vos mots clés principaux peut accélérer le développement de vos affaires en ligne d'affaires. Il faudra donc travailler pour maintenir ses positions, le fait de les perdre peut conduire rapidement à la faillite !
A propos de l'auteur
Article Exclusif
Vote: Pas encore voté
Identifiez-vous pour voter