Previous Up Next

Sur ce qui est demandé

Le repérage d'erreur se fait bien. Mais j'aurais encore voulu savoir
s'il fallait se limiter au repérage et à la correction de ces erreurs
uniquement avec les balises de texte.
Non, vous pouvez tout corriger si vous voulez (c'est pas facile). Mais ça ne vient que dans un deuxième temps. La correction des erreurs ne fait pas partie du minimum demandé mais des extensions.

L'exigence à suivre au départ est : si le HTML en entrée est correct, alors le HTML produit est correct. Cette exigence vous laisse libre de faire ce que vous voulez avec du HTML incorrect, (arrêter sur échec si l'incorrection est repérée ou produire du HTML incorrect si l'incorrection n'est pas repérée). Par exemple, si le texte en entrée comprend le HTML incorrect suivant :
<BLOCKQUOTE>Coucou</BLOCK>
Alors vous pouvez rendre la même chose en sortie sans vous sentir coupable. Ici cela revient à dire qu'il n'est pas nécessaire de vérifier le bon parenthésage des balises des éléments de niveau bloc. Au passage, l'hypothèse de correction de l'entrée garantit que les éléments ne niveau texte ne contiennent pas d'éléments de niveau bloc. Il est donc clair que l'on peut se passer entièrement de reconnaître les éléments de niveau bloc et que le langage formel sur lequel on travaille est réduit par rapport à HTML complet. Ce langage réduit est à mon avis justifiable d'une analyse synaxique simple.


Previous Up Next