Web sémantique : RDFa Lite joue et gagne

Le Web sémantique. Derrière ce nom se cache l’idée d’ajouter du sens (de la sémantique) sur des éléments HTML. Je tente ici un récapitulatif des évolutions dans le domaine.

Deux standards sont en concurrence depuis des années : RDFa et les microdata (ces dernières héritent des microformats conçus pour HTML4).

Depuis quelques années on pouvait lire que RDFa était le futur standard, préféré par le W3C. Mais il était complexe et alourdissait considérablement les pages Web. Aussi Google avait-il opté pour une implémentation des microformats. Les microformats sont un détournement des classes CSS : des mot-clés spécifiés par les microformats sont utilisés comme marqueurs parmi les classes CSS. Le principal inconvénient de cette technique est qu’elle n’est pas propre : deux normes se mélangent car il est tentant de styler (en CSS) des marqueurs microformats. En 2011 avec la sortie de HTML5 et des nouveaux attributs itemXXX valables sur tous les éléments HTML, le principal inconvénient de ce standard était balayé : les microformats devenus microdata devenaient plus crédibles. Pour en savoir plus sur les microdata et les microformats, je suggère ce tutoriel.

Un juin 2011 Google, Bing et Yahoo! s’étaient unis pour sortir schema.org, un catalogue de schémas pour microdata. Et ce catalogue s’est, depuis, enrichi avec constance de schémas touchant de nombreux domaines.

Un an plus tard, en juin 2012, le W3C fait de RDFa un standard officiel. Un sous-ensemble simplifié de la nouvelle norme est publié également : RDFa Lite dont la spécification est ici (en anglais). RDFa Lite est destiné à remplacer les microdata, et de fait il est d’une simplicité comparable aux microdata. On peut utiliser avec RDFa Lite le catalogue schema.org. Entre temps Google a commencé à implémenter RDFa : au final, c’est RDFa qui a gagné. Pour en savoir plus sur pourquoi et comment passer des microdata à RDFa Lite, lire l’article de Manu Sporny (en anglais).

Cette histoire a une conséquence. Jusqu’à juin dernier l’indécision entre deux standards poussait la plupart des acteurs du Web à attendre. Le Web sémantique n’était pas mature. Aujourd’hui le problème est tranché. Le Web sémantique, c’est faire porter du sens à des éléments HTML afin de les rendre utilisables par des robots. Et les premiers robots du Web sont ceux des moteurs de recherche. À l’avenir le référencement des sites Web qui n’implémenteront pas RDFa Lite sera désavantagé.

Leave a Reply

Your email address will not be published. Required fields are marked *

Mesure anti-spam. Merci de copier le code « fA5SZd » dans le champ ci-dessous :