statistiques sur le codage HTML des pages webGoogle Code participe au groupe de travail WHAT qui fait des propositions d'évolution du standard HTML (j'ignore quelle est sa relation avec le W3C). A ce titre, ils ont analysé pas moins d'un milliard de pages web afin de se rendre compte de la façon dont les webmasters utilisent le langage HTML. Voici quelques uns des résultats :

  • les pages web utilisent en moyenne 19 éléments HTML différents
  • après html, head et title, c'est la balise a qui arrive en 4ème position des balises les plus utilisées
  • plus de la moitié des liens définissent un attribut target
  • 24% des images n'ont pas d'attribut alt
  • parmi les balises meta, les plus fréquentes sont keywords et description
  • ils confirment que le fameux meta revisit-after ne sert strictement à rien ! ils précisent qu'il n'a été exploité que par un seul moteur de recherche dans le passé...

Le détail est disponible ici (en anglais).