?>
vendredi 15 octobre 2004 - 12h21
A la lecture des billets respectifs de Denis Boudreau (Cybercodeur) et Niko, je ne pouvais qu'avoir envie de répondre, ou plutôt poursuivre.
Plutôt que de réfléchir su Google tient compte de la sémantique pour attribuer des points en référencement, je pense qu'il convient plutôt de réflchir dans le bon sens des évènements. En réalité, dans les cas concrets, Google se contrefout de savoir si tel ou tel si est valide XHTML et qu'il utilise de belles classes CSS. Concrètement, le fait qu'un site bien construit sémantiquement, respectant les standards gagne des points aux yeux de google est une conséquence plutôt qu'une cause.
Je m'explique :
Google se balade sur vos pages, lit le code qu'il est capable de lire, l'enregistre, mastique tout ça pour en comprendre l'importance de la page par rapport à un ou plusieurs mots clés. Il suit des règles particulières, qui forment au total son algorythme. Plus vous tendez vers le respect complet de son algorythme, mieux vous êtes classé. Sans compter les histoires de backlink, ça se passe grosso-modo comme ça.
Ensuite, il convient donc de s'intéresser à ce que pourrait ressembler cet algorythme.
Là, on se dit deux choses :
La première, c'est que le moteur de google est nettement plus bête que vous et moi. Il ne voit pas les images, il ne fait que grossièrement comprendre les balises, et lit le contenu texte dedans. Donc pour faire son petit calcul, il ne peut se baser que là dessus. En gros, ce qu'il peut faire pour le texte, c'est regarder le nombre de fois qu'un mot est répété dans la page, sa place dans la page, le nombre de caractères qui séparent deux occurences du mot etc. D'un point de vue balisage, cela peut lui permettre de mettre des coéficients sur les points précédemment donnés. Donc concrètement, l'intérêt de la sémantique bat son plein ici. L'utilisation de balises qui déterminent l'importance dans la page renseignent sans aucun doute sur la valeur de tel ou tel mot. Inserer un mot dans un titre ou un sous titre de la page, évidemment que cela signifie que ce mot a de l'importance par rapport au contenu, Google l'a bien compris et applique la recette.
La seconde consiste à se dire que l'utilisation de la sémantique, et plus précisément l'effort de construire des sites en XHTML et CSS revient à faire l'effort de parler correctement l' HTML. L'utilisation abusive des tableaux de mise en forme ou des balises font nous éloignent d'un code HTML purement structurel tel qu'il devrait être. Ainsi, l'utilisation des standards réduit non seulement l'utilisation de balises, mais aussi et du coup augmente le rapport poids du texte indexable / poids du code complet. Le texte prend donc de l'importance en proportion pour Google, donc au final, vous avez tout bénéfice.
Ce débat pourrait être poursuivi sans fin. Tant que les moteurs de recherche ne communiqueront pas sur les techniques à adopter et à éviter pour le référencement, on pourra toujours poser des hypothèses sur les algorythmes des moteurs.
Mais j'en suis persuadé à travers cette explication, Google aime la sémantique, volontairement ou non. S'ils pouvaient communiquer officiellement dessus, quel bonheur ce serait pour la "défense" des standards.
Je suis entièrement d'accord sur le rapport poids du texte indexable / poids du code complet, néanmoins en ce qui concerne la "communication" sur l'algorithme et les standards, c'est ce qui fait tous le secret de google, et ce qui leur permet aussi de faire remonter des sites moyennant finance...
D'un autre côté, le jour où l'algorithme de google sera révélé, le grand "jeu" sera de le contourner... je suis parfois désespéré par certaines pratiques !
HS : le cadre des commentaires est vraiment petit :-)
par
Biologeek
Google se fout royalement d'une bonne synthaxe, seul le contenu qui lui est accessible plus l'analyse des backlinks est pris en compte pour le classement. La pertinence d'un resultat de moteur de recherche ne depend pas d'une structure de page.
Il est tout à fait possible de faire une page bien positionnée sans etre conforme à quelques normes que ce soit.
Bref, un article lucide...
par Denis
Je suis tout à fait d'accord sur l'augmentation du rapport contenu/code. Il est clair que cela plait à Google.
Peut-être est-ce aussi dûs aux auteurs qui en ayant un site plus facile à maintenir et plus léger, font du contenu plus intéressant et sont plus motivés pour mettre des liens ou des balises titre...
PS: Ça s'écrit algorithme :)
par
Anubis
Dans le même ordre d'idée :
Référencement sites Flash
Référencement sur Yahoo
Scrabble en XHTML CSS Javascript
Coloration syntaxique XHTML
Rendre Dreamweaver compatible XHTML



Actualités