11 juillet 2023

Propriétés de nœud : type, balise et contenu

Voyons plus en détail les nœuds DOM.

Dans ce chapitre, nous verrons plus en détail ce qu’ils sont et découvrirons leurs propriétés les plus utilisées.

Classes de nœud DOM

Différents nœuds DOM peuvent avoir des propriétés différentes. Par exemple, un nœud élément correspondant à la balise <a> a des propriétés liées aux liens, et celui correspondant à <input> a des propriétés liées aux entrées, etc. Les nœuds texte ne sont pas identiques aux nœuds élément. Mais il existe également des propriétés et des méthodes communes à chacun d’entre eux, car toutes les classes de nœuds DOM forment une hiérarchie unique.

Chaque nœud DOM appartient à la classe intégrée correspondante.

La racine de la hiérarchie est EventTarget, hérité par Node, et d’autres nœuds DOM en héritent.

Voici l’image, les explications à suivre :

Les classes sont :

EventTarget – est la classe racine “abstraite” pour tout.

Les objets de cette classe ne sont jamais créés. Ils servent de base, afin que tous les nœuds DOM supportent les soi-disant “événements”, nous les étudierons plus tard.
Node – est également une classe “abstraite”, servant de base aux nœuds DOM.

Elle fournit la fonctionnalité de l’arborescence de base : parentNode, nextSibling, childNodes et ainsi de suite (ce sont des getters). Les objets de la classe Node ne sont jamais créés. Mais il existe d’autres classes qui en héritent (et héritent donc de la fonctionnalité Node).
Document, pour des raisons historiques souvent héritées par HTMLDocument (bien que la dernière spécification ne le dicte pas) – est un document dans son ensemble.

L’objet global document appartient exactement à cette classe. Il sert de point d’entrée au DOM.
CharacterData – une classe “abstraite”, héritée par :
- Text – la classe correspondant à un texte à l’intérieur des éléments, par ex. Bonjour dans <p>Bonjour</p>.
- Comment – la classe pour les commentaires. Ils ne sont pas affichés, mais chaque commentaire devient un membre du DOM.
Element – est la classe de base des éléments DOM.

Elle fournit une navigation au niveau des éléments comme nextElementSibling, children et des méthodes de recherche comme getElementsByTagName, querySelector.

Un navigateur prend en charge non seulement HTML, mais également XML et SVG. Ainsi, la classe Element sert de base à des classes plus spécifiques : SVGElement, XMLElement (nous n’en avons pas besoin ici) et HTMLElement.
Enfin, HTMLElement est la classe de base pour tous les éléments HTML. Nous travaillerons avec lui la plupart du temps.

Elle est héritée par des éléments HTML concrets :
- HTMLInputElement – la classe pour les éléments <input>,
- HTMLBodyElement – la classe pour les éléments <body>,
- HTMLAnchorElement – la classe pour les éléments <a>,
- …etc.

Il existe de nombreuses autres balises avec leurs propres classes qui peuvent avoir des propriétés et des méthodes spécifiques, tandis que certains éléments, tels que <span>, <section>, <article> n’ont pas de propriétés spécifiques, ce sont donc des instances de la classe HTMLElement.

Ainsi, l’ensemble complet des propriétés et des méthodes d’un nœud donné est le résultat de la chaîne de l’héritage.

Par exemple, considérons l’objet DOM pour un élément <input>. Il appartient à la classe HTMLInputElement.

Il obtient les propriétés et les méthodes en superposition de (répertoriées dans l’ordre d’héritage) :

HTMLInputElement – cette classe fournit des propriétés spécifiques à l’entrée,
HTMLElement – elle fournit des méthodes d’élément HTML communes (et des getters/setters),
Element – fournit des méthodes d’élément génériques,
Node – fournit des propriétés de noeud DOM communes,
EventTarget – apporte du support aux événements (à couvrir),
…et finalement il hérite de Object, donc les méthodes “plain object” comme hasOwnProperty sont également disponibles.

Pour voir le nom de la classe de noeud DOM, nous pouvons rappeler qu’un objet a généralement la propriété constructor. Il fait référence au constructeur de classe, et constructor.name est son nom :

alert( document.body.constructor.name ); // HTMLBodyElement

…Or we can just toString it:

alert( document.body ); // [object HTMLBodyElement]

Nous pouvons également utiliser instanceof pour vérifier l’héritage :

alert( document.body instanceof HTMLBodyElement ); // true
alert( document.body instanceof HTMLElement ); // true
alert( document.body instanceof Element ); // true
alert( document.body instanceof Node ); // true
alert( document.body instanceof EventTarget ); // true

Comme nous pouvons le voir, les nœuds DOM sont des objets JavaScript normaux. Ils utilisent des classes basées sur des prototypes pour l’héritage.

C’est aussi facile à voir en sortant un élément avec console.dir (elem) dans un navigateur. Là, dans la console, vous pouvez voir HTMLElement.prototype, Element.prototype et ainsi de suite.

La plupart des navigateurs prennent en charge deux commandes dans leurs outils de développement : console.log et console.dir. Elles sortent leurs arguments dans la console. Pour les objets JavaScript, ces commandes font généralement la même chose.

Mais pour les éléments DOM, elles sont différents :

console.log(elem) affiche l’arborescence DOM de l’élément.
console.dir(elem) affiche l’élément en tant qu’objet DOM, bon pour explorer ses propriétés.

Essayez les sur document.body.

Dans la spécification, les classes DOM ne sont pas décrites en utilisant JavaScript, mais une Interface description language spéciale (IDL), qui est généralement facile à comprendre.

Dans IDL, toutes les propriétés sont précédées de leurs types. Par exemple, DOMString, boolean et ainsi de suite.

En voici un extrait, avec des commentaires :

          // Definir HTMLInputElement
// Le signe deux-points ":" signifie que HTMLInputElement hérite de HTMLElement
interface HTMLInputElement: HTMLElement {
  // ici les propriétés et méthodes des éléments <input>

  // "DOMString" signifie que la valeur d'une propriété est une chaîne de caractères
  attribute DOMString accept;
  attribute DOMString alt;
  attribute DOMString autocomplete;
  attribute DOMString value;

  // propriété de valeur booléenne (true/false)
  attribute boolean autofocus;
  ...
  // maintenant la méthode : "void" signifie que la méthode ne renvoie aucune valeur
  void select();
  ...
}
        

La propriété “nodeType”

La propriété nodeType fournit une autre méthode “à l’ancienne” pour obtenir le “type” d’un nœud DOM.

Il a une valeur numérique :

elem.nodeType == 1 pour les nœuds élément,
elem.nodeType == 3 pour les nœuds texte,
elem.nodeType == 9 pour l’objet document,
il y a peu d’autres valeurs dans la spécification.

Par exemple :

<body>
  <script>
  let elem = document.body;

  // examinons ceci : quel type de nœud est dans elem ?
  alert(elem.nodeType); // 1 => element

  // et son premier enfant est...
  alert(elem.firstChild.nodeType); // 3 => text

  // pour l'objet document, le type est 9
  alert( document.nodeType ); // 9
  </script>
</body>

Dans les scripts modernes, nous pouvons utiliser instanceof et d’autres tests basés sur les classes pour voir le type de nœud, mais parfois nodeType peut être plus simple. Nous pouvons seulement lire nodeType, pas le changer.

Balise : nodeName et tagName

Étant donné un nœud DOM, nous pouvons lire son nom de balise dans les propriétés nodeName ou tagName :

Par exemple :

alert( document.body.nodeName ); // BODY
alert( document.body.tagName ); // BODY

Y a-t-il une différence entre tagName et nodeName ?

Bien sûr, la différence se reflète dans leurs noms, mais c’est en effet un peu subtile.

La propriété tagName existe uniquement pour les nœuds Element.
Le nodeName est défini pour tout Node :
- pour les éléments, cela signifie la même chose que tagName.
- pour les autres types de nœuds (texte, commentaire, etc.), il a une chaîne de caractères avec le type de nœud.
En d’autres termes, tagName est uniquement pris en charge par les nœuds élément (car il provient de la classe Element), tandis que nodeName peut dire quelque chose sur d’autres types de nœuds.

Par exemple, comparons tagName et nodeName pour le document et un nœud de commentaire :

<body><!-- commentaire -->

  <script>
    // pour le commentaire
    alert( document.body.firstChild.tagName ); // undefined (pas un élément)
    alert( document.body.firstChild.nodeName ); // #comment

    // pour le document
    alert( document.tagName ); // undefined (pas un élément)
    alert( document.nodeName ); // #document
  </script>
</body>

Si nous ne traitons que des éléments, nous pouvons utiliser à la fois tagName et nodeName – il n’y a pas de différence.

Le navigateur a deux modes de traitement des documents: HTML et XML. Habituellement, le mode HTML est utilisé pour les pages Web. Le mode XML est activé lorsque le navigateur reçoit un document XML avec l’en-tête : Content-Type: application/xml+xhtml.

En mode HTML, tagName/nodeName est toujours en majuscule : c’est BODY pour <body> ou <BoDy>.

En mode XML, la casse est conservée “en l’état”. De nos jours, le mode XML est rarement utilisé.

innerHTML: les contenus

La propriété innerHTML permet d’obtenir le HTML à l’intérieur de l’élément sous forme de chaîne de caractères.

Nous pouvons également le modifier. C’est donc l’un des moyens les plus puissants de modifier la page.

L’exemple montre le contenu de document.body puis le remplace complètement :

<body>
  <p>A paragraph</p>
  <div>A div</div>

  <script>
    alert( document.body.innerHTML ); // lit le contenu actuel
    document.body.innerHTML = 'The new BODY!'; // le remplace
  </script>

</body>

Nous pouvons essayer d’insérer du code HTML invalide, le navigateur corrigera nos erreurs :

<body>

  <script>
    document.body.innerHTML = '<b>test'; // oublié de fermer la balise
    alert( document.body.innerHTML ); // <b>test</b> (corrigé)
  </script>

</body>

Si innerHTML insère une balise <script>dans le document – elle devient une partie du HTML, mais ne s’exécute pas.

Attention : “innerHTML+=” fait un écrasement complet

Nous pouvons ajouter du HTML à un élément en utilisant elem.innerHTML+="more html".

Comme ceci :

          chatDiv.innerHTML += "<div>Hello<img src='smile.gif'/> !</div>";
chatDiv.innerHTML += "How goes?";
        

Mais nous devons faire très attention à le faire, car ce qui se passe n’est pas un ajout, mais une réécriture complète.

Techniquement, ces deux lignes font de même :

          elem.innerHTML += "...";
// is a shorter way to write:
elem.innerHTML = elem.innerHTML + "..."
        

En d’autres termes, innerHTML+= fait ceci :

L’ancien contenu est supprimé.
Le nouveau innerHTML est écrit à la place (une concaténation de l’ancien et du nouveau).

Comme le contenu est “remis à zéro” et réécrit à partir de zéro, toutes les images et autres ressources seront rechargées.

Dans l’exemple chatDiv au-dessus de la ligne chatDiv.innerHTML+="How goes?" recrée le contenu HTML et recharge smile.gif (espérons qu’il est mis en cache). Si chatDiv a beaucoup d’autres textes et images, alors le rechargement devient clairement visible.

Il existe également d’autres effets secondaires. Par exemple, si le texte existant a été sélectionné avec la souris, la plupart des navigateurs supprimeront la sélection lors de la réécriture de “innerHTML”. Et s’il y avait un <input> avec un texte entré par le visiteur, alors le texte sera supprimé. Etc.

Heureusement, il existe d’autres façons d’ajouter du HTML en plus de innerHTML, et nous les étudierons bientôt.

outerHTML : HTML complet de l’élément

La propriété outerHTML contient le code HTML complet de l’élément. C’est comme innerHTML plus l’élément lui-même.

Voici un exemple :

<div id="elem">Hello <b>World</b></div>

<script>
  alert(elem.outerHTML); // <div id="elem">Hello <b>World</b></div>
</script>

Attention : contrairement à innerHTML, l’écriture dans outerHTML ne modifie pas l’élément. Au lieu de cela, il le remplace dans le DOM.

Oui, cela semble étrange, et c’est étrange, c’est pourquoi nous en faisons une note séparée ici. Jetez-y un oeil.

Prenons l’exemple :

<div>Hello, world!</div>

<script>
  let div = document.querySelector('div');

  // remplace div.outerHTML avec <p>...</p>
  div.outerHTML = '<p>A new element</p>'; // (*)

  // Wow! 'div' est toujours la même !
  alert(div.outerHTML); // <div>Hello, world!</div> (**)
</script>

Ça a l’air vraiment bizarre, non ?

Dans la ligne (*) nous avons remplacé div par <p>A new element</p>. Dans le document externe (le DOM), nous pouvons voir le nouveau contenu au lieu de <div>. Mais, comme nous pouvons le voir dans la ligne (**), la valeur de l’ancienne variable div n’a pas changé !

L’affectation outerHTML ne modifie pas l’élément DOM (l’objet référencé, dans ce cas, la variable ‘div’), mais le supprime du DOM et insère le nouveau HTML à sa place.

Donc, ce qui s’est passé dans div.outerHTML=... est :

div a été supprimé du document.
Un autre morceau du HTML <p>A new element</p> a été inséré à sa place.
div a toujours son ancienne valeur. Le nouveau HTML n’a été enregistré dans aucune variable.

Il est si facile de faire une erreur ici : modifiez div.outerHTML puis continuez à travailler avec div comme s’il contenait le nouveau contenu. Mais ce n’est pas le cas. Ce genre de chose est correcte pour innerHTML, mais pas pour outerHTML.

Nous pouvons écrire dans elem.outerHTML, mais nous devons garder à l’esprit que cela ne change pas l’élément dans lequel nous écrivons (‘elem’). Il place le nouveau HTML à sa place. Nous pouvons obtenir des références aux nouveaux éléments en interrogeant le DOM.

nodeValue/data : contenu du nœud texte

La propriété innerHTML n’est valide que pour les nœuds élément.

D’autres types de nœuds, tels que les nœuds texte, ont leur contrepartie : les propriétés nodeValue et data. Ces deux sont presque les mêmes pour une utilisation pratique, il n’y a que des différences de spécifications mineures. Nous allons donc utiliser data, car il est plus court.

Un exemple de lecture du contenu d’un nœud texte et d’un commentaire :

<body>
  Hello
  <!-- Commentaire -->
  <script>
    let text = document.body.firstChild;
    alert(text.data); // Hello

    let comment = text.nextSibling;
    alert(comment.data); // Commentaire
  </script>
</body>

Pour les nœuds texte, nous pouvons imaginer une raison de les lire ou de les modifier, mais pourquoi des commentaires ?

Parfois, les développeurs incorporent des informations ou des instructions de modèle dans HTML, comme ceci :

          <!-- if isAdmin -->
  <div>Welcome, Admin!</div>
<!-- /if -->
        

…Ensuite, JavaScript peut le lire à partir de la propriété data et traiter les instructions intégrées.

textContent: texte pur

Le textContent donne accès au texte à l’intérieur de l’élément : seulement le texte, moins tous les <tags>.

Par exemple :

<div id="news">
  <h1>Headline!</h1>
  <p>Martians attack people!</p>
</div>

<script>
  // Headline! Martians attack people!
  alert(news.textContent);
</script>

Comme nous pouvons le voir, seul le texte est renvoyé, comme si tous les <tags> étaient supprimés, mais le texte qu’ils contenaient est resté.

En pratique, la lecture d’un tel texte est rarement nécessaire.

Ecrire dans textContent est beaucoup plus utile, car il permet d’écrire du texte de “manière sûre”.

Disons que nous avons une chaîne de caractères arbitraire, par exemple entrée par un utilisateur, et que nous voulons l’afficher.

Avec innerHTML nous allons l’insérer “au format HTML”, avec toutes les balises HTML.
Avec textContent nous allons l’insérer “en tant que texte”, tous les symboles sont traités littéralement.

Comparez les deux :

<div id="elem1"></div>
<div id="elem2"></div>

<script>
  let name = prompt("What's your name?", "<b>Winnie-the-Pooh!</b>");

  elem1.innerHTML = name;
  elem2.textContent = name;
</script>

La première <div> obtient le nom “en HTML” : toutes les balises deviennent des balises, nous voyons donc le nom en gras.
La seconde <div> obtient le nom “sous forme de texte”, donc nous voyons littéralement <b>Winnie-the-pooh!</b>.

Dans la plupart des cas, nous attendons le texte d’un utilisateur et souhaitons le traiter comme du texte. Nous ne voulons pas de HTML inattendu sur notre site. Une affectation à textContent fait exactement cela.

La propriété “cachée”

L’attribut “hidden” (caché) et la propriété DOM spécifient si l’élément est visible ou non.

Nous pouvons l’utiliser dans le HTML ou l’attribuer en utilisant JavaScript, comme ceci :

<div>Both divs below are hidden</div>

<div hidden>With the attribute "hidden"</div>

<div id="elem">JavaScript assigned the property "hidden"</div>

<script>
  elem.hidden = true;
</script>

Techniquement, hidden fonctionne de la même manière que style="display:none". Mais c’est plus court à écrire.

Voici un élément clignotant :

<div id="elem">A blinking element</div>

<script>
  setInterval(() => elem.hidden = !elem.hidden, 1000);
</script>

Plus de propriétés

Les éléments DOM ont également des propriétés supplémentaires, en particulier celles qui dépendent de la classe :

value – la valeur pour <input>, <select> et <textarea> (HTMLInputElement, HTMLSelectElement…).
href – le “href” pour <a href="..."> (HTMLAnchorElement).
id – la valeur de l’attribut “id”, pour tous les éléments (HTMLElement).
…et beaucoup plus…

Par exemple :

<input type="text" id="elem" value="value">

<script>
  alert(elem.type); // "text"
  alert(elem.id); // "elem"
  alert(elem.value); // value
</script>

La plupart des attributs HTML standard ont la propriété DOM correspondante, et nous pouvons y accéder comme ça.

Si nous voulons connaître la liste complète des propriétés prises en charge pour une classe donnée, nous pouvons les trouver dans la spécification. Par exemple, HTMLInputElement est documenté à https://html.spec.whatwg.org/#htmlinputelement.

Ou si nous voulons les obtenir rapidement ou encore si nous sommes intéressés par une spécification concrète de navigateur – nous pouvons toujours sortir l’élément en utilisant console.dir(elem) et lire les propriétés. Ou explorez les “propriétés DOM” dans l’onglet Éléments des outils de développement du navigateur.

Résumé

Chaque nœud DOM appartient à une certaine classe. Les classes forment une hiérarchie. L’ensemble complet des propriétés et des méthodes résulte de l’héritage.

Les propriétés principales du nœud DOM sont :

nodeType: Nous pouvons l’utiliser pour voir si un nœud est un texte ou un nœud d’élément. Il a une valeur numérique: 1 pour les éléments, 3 pour les nœuds de texte et quelques autres pour les autres types de nœuds. Lecture seulement.
nodeName/tagName: Pour les éléments, nom de balise (en majuscules sauf en mode XML). Pour les nœuds non-élément, nodeName décrit ce que c’est. Lecture seulement.
innerHTML: Le contenu HTML de l’élément. Peut être modifié.
outerHTML: Le code HTML complet de l’élément. Une opération d’écriture dans elem.outerHTML ne touche pas elem lui-même. Au lieu de cela, il est remplacé par le nouveau HTML dans le contexte externe.
nodeValue/data: Le contenu d’un nœud non élément (texte, commentaire). Ces deux sont presque les mêmes, nous utilisons généralement data. Peut être modifié.
textContent: Le texte à l’intérieur de l’élément : le HTML moins tous les <tags>. L’écriture met le texte à l’intérieur de l’élément, avec tous les caractères spéciaux et balises traités exactement comme du texte. Peut insérer en toute sécurité du texte généré par l’utilisateur et protéger contre les insertions HTML indésirables.
hidden: Lorsqu’il est défini sur true, fait la même chose que CSS display:none.

Les nœuds DOM ont également d’autres propriétés en fonction de leur classe. Par exemple, les éléments <input> (HTMLInputElement) prennent en charge value, type, tandis que les éléments <a> (HTMLAnchorElement) prennent en charge href etc. La plupart des attributs HTML standard ont une propriété DOM correspondante.

Cependant, les attributs HTML et les propriétés DOM ne sont pas toujours les mêmes, comme nous le verrons dans le chapitre suivant.

Exercices

Compter les descendants

Il y a un arbre structuré comme un ul/li imbriqué.

Écrivez le code qui pour que chaque <li> affiche :

Quel est le texte à l’intérieur (sans le sous-arbre)
Le nombre de <li> imbriqués – tous les descendants, y compris ceux profondément imbriqués.

Démo dans une nouvelle fenêtre

Open a sandbox for the task.

Faisons une boucle dans le <li>:

          for (let li of document.querySelectorAll('li')) {
  ...
}
        

Dans la boucle, nous devons obtenir le texte à l’intérieur de chaque li.

Nous pouvons lire le texte du premier nœud enfant de li, c’est-à-dire le nœud texte :

          for (let li of document.querySelectorAll('li')) {
  let title = li.firstChild.data;

  // title est le texte dans <li> avant tout autre noeud
}
        

Ensuite, nous pouvons obtenir le nombre de descendants comme li.getElementsByTagName('li').length.

Ouvrez la solution dans une sandbox.

Qu'y a-t-il dans le nodeType ?

Qu’affiche le script ?

          <html>

<body>
  <script>
    alert(document.body.lastChild.nodeType);
  </script>
</body>

</html>
        

Il y a un piège ici.

Au moment de l’exécution de <script>, le dernier nœud DOM est exactement <script>, car le navigateur n’a pas encore traité le reste de la page.

Le résultat est donc 1 (nœud élément).

<html>

<body>
  <script>
    alert(document.body.lastChild.nodeType);
  </script>
</body>

</html>

Balise dans le commentaire

Qu’affice ce code ?

          <script>
  let body = document.body;

  body.innerHTML = "<!--" + body.tagName + "-->";

  alert( body.firstChild.data ); // Qu'est ce qu'il y a ici ?
</script>
        

La réponse : BODY.

<script>
  let body = document.body;

  body.innerHTML = "<!--" + body.tagName + "-->";

  alert( body.firstChild.data ); // BODY
</script>

Ce qui se passe pas à pas :

Le contenu de <body> est remplacé par le commentaire. Le commentaire est , car body.tagName == "BODY". Comme nous nous en souvenons, tagName est toujours en majuscule en HTML.
Le commentaire est maintenant le seul nœud enfant, donc nous l’avons dans body.firstChild.
La propriété data du commentaire est son contenu (à l’intérieur ) : "BODY".

Où est le "document" dans la hiérarchie ?

À quelle classe appartient le document ?

Quelle est sa place dans la hiérarchie DOM ?

Hérite-t-il de Node ou Element, ou peut-être de HTMLElement ?

Nous pouvons voir à quelle classe il appartient en le sortant, comme :

alert(document); // [object HTMLDocument]

Ou :

alert(document.constructor.name); // HTMLDocument

Ainsi, document est une instance de la classe HTMLDocument.

Quelle est sa place dans la hiérarchie ?

Oui, nous pourrions parcourir les spécifications, mais il serait plus rapide de le déterminer manuellement.

Parcourons la chaîne du prototype via __proto__.

Comme nous le savons, les méthodes d’une classe sont dans le prototype du constructeur. Par exemple, HTMLDocument.prototype a des méthodes pour les documents.

De plus, il y a une référence à la fonction constructeur à l’intérieur du prototype :

alert(HTMLDocument.prototype.constructor === HTMLDocument); // true

Pour obtenir le nom de la classe sous forme de chaîne de caractères, nous pouvons utiliser constructor.name. Faisons-le pour toute la chaîne du prototype de document, jusqu’à la classe Node :

alert(HTMLDocument.prototype.constructor.name); // HTMLDocument
alert(HTMLDocument.prototype.__proto__.constructor.name); // Document
alert(HTMLDocument.prototype.__proto__.__proto__.constructor.name); // Node

Voilà la hiérarchie.

Nous pourrions également examiner l’objet en utilisant console.dir(document) et voir ces noms en ouvrant __proto__. La console les prend du constructeur en interne.

Carte du tutoriel

Commentaires

lire ceci avant de commenter…

Propriétés de nœud : type, balise et contenu

Classes de nœud DOM

La propriété “nodeType”

Balise : nodeName et tagName

innerHTML: les contenus

Attention : “innerHTML+=” fait un écrasement complet

outerHTML : HTML complet de l’élément

nodeValue/data : contenu du nœud texte

textContent: texte pur

La propriété “cachée”

Plus de propriétés

Résumé

Exercices

Compter les descendants

Qu'y a-t-il dans le nodeType ?

Balise dans le commentaire

Où est le "document" dans la hiérarchie ?

Commentaires

Chapitre

Navigation des cours