Que sont les « balises HTML indésirables » et pourquoi faut-il les supprimer ?

Que sont les « balises HTML indésirables » et pourquoi faut-il les supprimer ?

Sur Bulldoz, un message d’avertissement peut apparaître au sujet de « balises HTML indésirables » présentes dans un texte.

Je vais vous expliquer :

  • Que sont ces balises HTML indésirables.
  • Pourquoi il est important de les supprimer.
  • Comment les supprimer.
  • Comment ne plus avoir ce type de problème.

La mise en forme d’un texte avec le HTML

Lorsqu’on rédige un texte pour le web, des balises HTML (invisibles pour les humains) sont intégrées automatiquement dans le texte. Elles permettent d’indiquer aux machines comment mettre en forme le texte.

Les balises HTML de base sont :

<p></p> : indique que le texte compris entre ces balises est un paragraphe.

<h2></h2> : un titre.

<h3></h3> : un sous-titre.

<h4></h4> : un sous-sous-titre.

<ul><li></li></ul>: une liste à puces.

<strong></strong> : pour mettre en gras le texte.

Ces balises sont généralement suffisantes pour mettre en forme un texte sur un site web classique.

A noter : la balise <h1></h1> représente le titre global du texte, elle ne devrait donc pas faire partie du contenu du texte.

Exemple de balisage HTML

Voici le code HTML d’un texte basique :

<h2>Voici le titre d'un texte bien formaté</h2>
<p>Les balises HTML peuvent sembler peu compréhensibles à première vue, mais elles sont très pratiques car <b>elles permettent à une machine de mettre en forme correctement le texte</b>. Il faut donc bien les utiliser.</p>
<p>Si vous êtes rédacteur web ou éditeur de sites, vous devez les connaître.</p>
<h2>Les avantages d'utiliser les balises HTML de base</h2>
<p>Elles sont :</p>
<ul>
<li>Compréhensibles par les humains et les machines.</li>
<li>Faciles à manipuler.</li>
<li>Adaptées à tous les supports informatiques (sites web, applications, logiciels...)</li>
</ul>
<p>Bref, les balises HTML de base n'ont que des avantages !</p>

Ce texte s’affichera de cette façon sur un site internet :

Simple non ? 🙂

Balises HTML complexes

Il existe des dizaines de balises et des centaines de subtilités qui permettent d’affiner la présentation d’un texte. Elles sont pratiques mais elles posent des problèmes lors de la publication d’un texte sur un site internet. Par exemple, il est possible d’afficher un paragraphe à une certaine taille, par exemple 14 pixels, en ajoutant de l’information dans une balise <p> :

<p style="font-size:14px">Ces lettes mesurent 14 pixels de hauteur.</p>

Cette information est parfaitement claire et ne posera à priori pas de souci. Du moins, jusqu’à la publication sur un site internet.

Imaginons que par défaut, tout le texte d’un site internet mesure 12 pixels, alors les phrases contenant cette information supplémentaire vont être affichées en plus grand que les autres. C’est un vrai problème en terme d’esthétique et pour la cohérence du site web (non respect de la charte graphique).

Le même souci se pose avec la police de caractère, la couleur du texte, la hauteur des lignes…

Ok, mais je n’utilise pas de balises HTML. En quoi cela me concerne-t-il ?

Vous n’utilisez peut-être pas les balises HTML, mais votre éditeur de texte lui en utilise. Et il en utilise certainement énormément !

Vous ne le savez sûrement pas, mais généralement, toutes les phrases d’un texte copié-collé à partir d’un éditeur de texte contiennent des informations supplémentaires dans le HTML ! Elles viendront polluer la mise en forme basique du site sur lequel le texte sera placé.

Vous devez vous assurer que vos textes utilisent uniquement les balises HTML de base pour qu’ils soient compatibles avec tous les sites.

Comment supprimer ces balises indésirables ?

1) Suppression manuelle

Vous pouvez nettoyer le code HTML manuellement en accédant à l’éditeur de code source sur Bulldoz :

Cette opération est fastidieuse, surtout si votre éditeur ajoute beaucoup d’informations au code HTML.

2) Suppression automatique

J’ai développé une fonctionnalité qui nettoie automatiquement le code HTML d’un texte. Il vous suffit de cocher la case correspondante et de valider pour que le nettoyage se fasse automatiquement. Pratique 🙂

MAIS ATTENTION : il existe des dizaines de caractères spéciaux, parfois invisibles, ainsi que des cas particuliers, qui peuvent gêner le nettoyeur et produire des bugs. Ces bugs peuvent endommager votre texte. Lorsque vous utilisez cette fonctionnalité veillez donc à enregistrer votre travail ailleurs que sur Bulldoz. Des milliers de textes ont déjà été nettoyés avec succès, j’ai donc un bon recul et généralement ça fonctionne parfaitement, mais mieux vaut être prudent et éviter de perdre une partie de son travail 😉

Comment éviter de générer des balises indésirables ?

En rédaction comme ailleurs, mieux vaut prévenir que guérir ! Pour utiliser uniquement des balises HTML basiques, il vous suffit de rédiger vos textes sur l’éditeur de textes de Bulldoz 👍 Pensez alors à valider régulièrement votre texte pour qu’il soit enregistré.

N’hésitez pas à utiliser les commentaires si vous avez des questions 🙂