XHTML specificaties

Ik kwam op de site van Henk van de Kamer weer wat tegen, iets wat overigens al van een tijd terug is. Het gaat om een controle over correcte HTML. Nu heb ik ook een mooi XHTML 1.0 logo op de site staan maar heb hier na een 1e controle nooit meer naar omgekeken. Tijd dus om hier even verandering in aan te brengen.

Als eerste het bash script maar even aanpassen naar mijn situatie:

#!/bin/bash

let i=1
while [ $i -le 141 ]; do
wget -q -O index.htm "http://validator.w3.org/check?uri=http%3A%2F%2Ftecumseh.homeip.net%2F%3Fp%3D$i"
echo "$i is "`grep -E '^( *)\[(Valid|Invalid)\]$' index.htm | sed -re 's/.*\[(.*)\]$/\1/'` >> checked.txt
rm index.htm
sleep 15
let i=i+1
done

Hieruit volgen een aantal fouten, het merendeel is overigens correct. De meeste fouten zitten tussen de <pre> tags. WordPress negeert hier over het algemeen de opmaak, zoals het hoort overigens.

Hier een opsomming van de aanpassingen:

  • Bericht 6: Het verwijderen van een harde return lost de fout op (<hr />)
  • Bericht 10: Het vervangen van de haakjes < en > door &lt; en &gt; in het fstab stukje
  • Bericht 63: Ik heb in tussen de <pre> tags een stuk staan waarin tekstueel een smiley zit, wordpress vervangt deze maar moet er eigenlijk vanaf blijven. Ik heb er dus een punt achter gezet zodat de smiley niet geconverteerd wordt.
  • Bericht 70: In het commentaar heb ik in een reactie een stuk van mijn fstab staan, hierin moesten de tekens < en > geconverteerd worden naar &lt; en &gt;
  • Bericht 82: WordPress geeft de <img> tag een backslash op het eind, na het toevoegen van een aantal extra parameters (width, heigt en class) vindt de validator dit geen probleem mee
  • Bericht 99: Ook hier weer een aantal < en > tekens die vervangen zijn door &lt; en &gt;