Accéder au contenu principal

Web sémantique, les Rich Snippets de Google

Pendant que Bing faisait une entrée remarquée sur la scéne des moteurs de recherche, Google a annoncé la semaine dernière la prise en charge de rich snippets par son moteur.

De quoi s'agit-il ? D'une formalisation du codage HTML des notations et avis, qu'on trouve maintenant sur la plupart des sites web, pour que les moteurs affiche ses données directement dans ses listes de résultats.

Ainsi, les sites web qui proposent à leur utilisateurs de noter et/ou annoter des produits ou services (livres, voyages, hôtels, matériel informatique...) pourront structurer l'information pour qu'elle devienne compréhensible par Google, et qu'elle prenne plus de sens que du simple texte.

Côté site web, cela implique une modification du balisage HTML afin d'utiliser le formalisme du microformat hreview ou un balisage RDFa
Côté moteur, les résultats d'une recherche affiche directement notes et commentaires.



Notez que pour le moment, le service s'ouvre progressivement, uniquement pour des sites qui en font la demande et qui sont sélectionnés.

Le SEO revisité

Considérons moteurs de recherche et sites web comme 2 univers voisins, dont la frontière est le lien proposé dans les résultats de recherche.

Tous les webmasters savent aujourd'hui qu'ils peuvent accroitre leur taux de fréquentation en améliorant le positionnement de leur site sur Google, sur des mots clés correctement choisis.

Si je place correctement mon site dans les SERP, j'augmente le volume d'utilisateurs qui voient mon site dans l'univers du moteur. Une fois qu'ils ont franchi la frontière, à moi de les intéresser, de les fidéliser, de leur faire acheter mes produits... dans mon univers.

Maintenant, imaginons qu'à la frontière entre les mondes apparait un panneau "Note 1/10 - Moyenne des avis de 30 utilisateurs". Que se passe t'il ?
Certains seront sans doute intéressés par lire les avis négatifs sur une référence produit précise, mais on peut facilement penser que pour une recherche générique, comme "appareil photo numérique", les produits non recommandés verront leur taux de clics diminués.

Jusqu'alors, un site proposait peut-être quelques produits peu recommandés, mais le visiteur était dans l'univers du site, et il pouvait se voir proposer d'autres produits à acheter dans la foulée.

Certes, recueillir des avis sur un produit n'est pas nouveau, mais jusqu'alors l'information est présente soit sur le site lui-même (Amazon, Rueducommerce...), soit sur un site externe (Ciao)
La différence ici, c'est le volume. Lorsque Google se met à afficher les avis produits, c'est une des plus grosses sources de nouveaux visiteurs qui peut en être affectée.

Les sites marchands auront-ils intérêt à utiliser ce système ?

Spamdexing 2.0

Google a toujours favorisé les sites à travers leur réputation informatique : le pagerank est un indicateur reflétant le succès d'un site à travers les liens que d'autres sites ont vers lui.
C'est ce qui a causé par exemple l'apparition du link farming.

Demain, si Google affiche les commentaires dans les résultats de recherche, peut-on s'attendre à une multiplication des faux avis pour booster la notation d'un produit dans Google ?

Une recherche universelle sur une base universelle

Difficile de terminer ce billet sans constater un des effets pervers du web sémantique : utiliser les mêmes formalismes (en quelque sorte parler la même langue) pour décrire intelligemment le contenu du web, c'est ouvrir des perspectives d'échanges et d'interactions peu ou pas exploitées à ce jour.
C'est aussi toutefois offrir encore un peu plus de données compréhensible à la pieuvre géante Google, qui n'en finit plus d'absorber le web tout entier.

En indexant les actualités, les images, en affichant la structure des sites (siteslinks), et maintenant avec les rich snippets, Google rediffuse de plus en plus de données qui ne lui appartiennent pas.

Et il peut se le permettre, tant sa position est forte : ne pas entrer dans le jeu de Google, c'est perdre du terrain sur ses concurrents qui le feront.

Commentaires

Posts les plus consultés de ce blog

La compression HTTP pour accélérer vos sites

Avec les récents changements et déclarations de Google autour de la prise en compte de la performance des sites comme un éventuel futur critère de pertinence des sites, les problématiques d'optimisation vont (re)devenir d'actualité. Un des moyens très rapide pour optimiser sensiblement les performances de son site web consiste à compresser le flux de données qui transite entre votre serveur et le navigateur Internet de vos visiteurs.

Les outils d'analyse de requêtes HTTP

L'analyse des échanges HTTP entre navigateur et serveur web est un bon moyen de détection des opérations les plus consommatrices en temps, soit celles qui impactent le plus le temps de chargement global d'une page. Tour d'horizon des outils gratuits existants : Outils en ligne D'une utilisation simple et rapide, ces outils proposent une vision synthétique des échanges à travers une chronologie précise des opérations, ainsi que le détail des requêtes et réponses HTTP. Toutefois, ils ne proposent généralement pas les mêmes options qu'un navigateur, notamment en terme de gestion de cache. site-perf.com Pingdom tools L'analyse de ce blog par Pingdom tools Plugins navigateurs Ces outils s'intègrent à votre navigateur, ce qui vous permet de simuler exactement les situations de configurations de vos visiteurs. Firefox Le compagnon idéal est l'extension livehttpheaders , outil de capture des requêtes et réponses HTTP Firebug propose également une analyse complè

Optimiser son site en maitrisant sa mise en cache

Précédemment dans notre quête de la performance, nous avions vu qu'à l'aide de quelques consignes données à notre serveur, nous pouvons alléger la quantité de données reçues par nos visiteurs sans les altérer. Poursuivons le raisonnement. Plutôt que d'alléger les données, posons-nous la question : mon visiteur a t-il vraiment besoin de recevoir cette donnée ? Le principe du cache navigateur est de stocker sur le disque dur du visiteur les composants de pages (images, scripts, page HTML), pour ne pas avoir à les recharger plus tard.