7 Extensions

Les fonctionnalités de TXM peuvent être augmentées par l’ajout d’extensions.

Pour ajouter une extension, voir la section 2.3 « Installer une extension ».

La documentation des extensions la plus à jour se trouve dans le wiki txm-users.

7.1 Extensions « TreeTagger software » et « TreeTagger en, fr models »

Les extensions « TreeTagger software » et « TreeTagger en, fr models » fonctionnent de concert pour appliquer le logiciel TreeTagger sur les corpus de textes anglais ou français importés dans TXM pour ajouter automatiquement des propriétés morphosyntaxiques et des lemmes à leurs mots. Il faut installer ces deux extensions pour que TreeTagger puisse être utilisé par TXM.

Leur installation est décrite à la section 2.2 « Installer TreeTagger pour ajouter automatiquement des propriétés morphosyntaxiques et des lemmes aux mots ».

Leur utilisation est décrite à la section 4.3.3 « Langue principale ».

7.1.1 Paramétrage de TreeTagger

L’appel de TreeTagger peut être configuré à partir de paramètres de la page de préférences « TXM > Avancé > TAL > TreeTagger » :
Préférences de paramètres d’appel de TreeTagger.

Figure 7.1: Préférences de paramètres d’appel de TreeTagger.

7.1.1.1 TreeTagger process options

Paramètres d’application d’un modèle de langue (étiquetage) :

  • Print the token rather than <unknown> for unknown lemma : true par défaut
    la forme graphique d’un mot est plus intéressante dans les listes de lemmes que la seule chaine « <unknown> ». à mettre à false pour découvrir les lemmes inconnus.
  • Look up unknown capitalized words in the list of lower-case words :
    pour autoriser le traitement de mots en Capitales iconnus comme des formes équivalentes en minuscules présentent dans le texte.
  • Turn on the heuristics for guessing the parts of speech of unknown hyphenated words :
    pour utiliser l’heuristique de détermination de la catégorie morpho-syntaxique des mots césurés inconnus
  • Print tag probabilities :
    ajouter une propriété encodant la probabilité d’attribution de la catégorie morpho-syntaxique
  • Read auxiliary lexicon entries from a file :
    utiliser un fichier de lexique complémentaire (un mot par ligne, voir la documentation de TreeTagger)
  • Read a word-class automaton from a file :
    utiliser un fichier d’automate de mot (voir la documentation de TreeTagger)

7.1.1.2 TreeTagger training process options

Paramètres d’apprentissage d’un modèle de langue :

  • consider <n> preceeding tags for tagging : 0 par défaut
    taille de la fenêtre de mots à utiliser pour désambiguiser le choix de la catégorie morpho-syntaxique
  • use <f> as threshold for decision tree gain : seuil de gain pour l’arbre de décision (voir la documentation de TreeTagger)
  • use <f> as smoothing weight : poids de lissage
  • use <f> as threshold for affix tree gain : seuil de gain pour l’arbre d’affixes
  • use <f> as equivalence class weight : poids des classes d’équivalence
  • use <f> as threshold probability for lexical entries (default 0.001) : seuil de probabilité pour le choix de mot

7.2 Extension Media Player

L’extension « Media Player » permet de jouer un extrait de vidéo ou d’audio depuis TXM.

L’extrait peut correspondre à la totalité d’un fichier ou d’un flux média ou à un extrait définit par une commande de TXM, comme les commandes Concordances ou Édition, à partir d’une transcription d’enregistrement.

Dans le deuxième cas il s’agit d’un « retour à la source » spécialisé pour les corpus multimédia, complémentaire au « retour au texte » classique (de la transcription).

7.2.1 Retour à la vidéo ou à l’audio depuis le résultat d’une commande TXM

Cette fonctionnalité est disponible pour les corpus de transcriptions d’enregistrements compatibles avec l’extension Media Player, comme le corpus exemple « P1S8 ».

La section 7.2.6 « Création d’un corpus de transcriptions compatible avec l’extension Media Player » présente les différents moyens d’en créer.

7.2.1.1 Depuis une concordance

Le retour à la vidéo ou à l’audio est opéré soit :

  • depuis le menu contextuel d’une ligne de concordance (clic droit) en lançant la commande « Jouer le média »
  • en sélectionnant une ligne de concordance puis en saisissant le raccourcis clavier « Ctrl-Màj-M »

Dans les deux cas, le passage contenant le pivot de la ligne est joué dans le lecteur multimédia intégré à TXM (la section 7.2.4 « Stratégies de construction d’empans de lecture » présente les différentes options de réglage des caractéristiques du passage).
Si l’édition de la transcription était déjà ouverte, le lecteur vidéo s’ouvre à côté de la transcription :

Retour à la vidéo d’une transcription automatique des commentaires d’un sujet des Actualités Françaises du 30 janvier 1968.

Figure 7.2: Retour à la vidéo d’une transcription automatique des commentaires d’un sujet des Actualités Françaises du 30 janvier 1968.

7.2.1.2 Depuis une édition

Le retour à la vidéo ou à l’audio est opéré soit :

  • depuis les boutons de lecture « ♫ » situés en début de section, de tour ou d’énoncé
  • depuis une sélection de mots, pour les transcriptions synchronisées aux mots près :
  1. sélectionner les mots de la transcription dont on veut visualiser/écouter l’enregistrement
  2. depuis le menu contextuel (clic droit) lancer la commande « Jouer le média »

En cas d’erreur de lecture de la vidéo ou de l’audio, un message de diagnostic est affiché dans la console de TXM.

7.2.1.3 Barre d’outils du lecteur multimedia

Barre d’outils du lecteur multimédia.

Figure 7.3: Barre d’outils du lecteur multimédia.

La barre d’outils est composée des élements suivants :

  • bouton « PAUSE/REPRENDRE » : suspendre la lecture / reprendre la lecture
  • bouton « STOP » : arrêter la lecture
  • indication de position « 04:57 » dans le média (minutes:secondes)
  • curseurs de lecture dans la durée totale de l’enregistrement :
  1. début de l’empan joué
  2. position de la lecture
  3. fin de l’empan joué
  • option « Répéter » la lecture de l’empan en boucle
  • option « Vit » : curseur de réglage de la vitesse de lecture, de 40% (x0,4) à 140% (x1,4) de la vitesse originale de lecture de l’enregistrement
  • option « Vol » : curseur de réglage du volume de lecture, de 0% à 100% du volume de lecture

7.2.2 Lecture directe d’enregistrement vidéo ou audio

La commande « Fichier > Ouvrir un fichier média… » permet de jouer un fichier vidéo ou audio directement à partir :

  • d’un répertoire local, se trouvant sur la machine exécutant TXM : cliquer sur le bouton « [] » pour naviguer jusqu’au fichier ;
  • d’une adresse web : par exemple https://mp4studio.ina.fr/lire/0tfeS_XRwVxMA3VJB7CXLDWJBONpLnXPltMy6DE_1RC13c0hsEhDetDCIEvUS4d-ZnXnaOEsNoF7OuI_-hC1lelZqwlrLC-KzVjJcsiKoYRgbO4s0S39Xz9ttoiRbzwA_Qas0jEc5ib4bnPlszIFuBw46. Copier/Coller l’adresse dans le champ « Saisir le chemin de fichier ou l’adresse web (URL) ».

7.2.3 Paramètres généraux du lecteur multimedia

Les paramètres sont modifiables dans la page de préférences « TXM > Utilisateur > Media PLayer » :
Paramètres du lecteur multimedia.

Figure 7.4: Paramètres du lecteur multimedia.

  • Répéter la lecture :
    lecture de l’empan en boucle
  • BackToMedia position :
    emplacement du lecteur à l’ouverture, par rapport à la fenêtre de concordance ou à la fenêtre d’édition, soit :
  • « ABOVE » : au dessus
  • « BELOW » : sous
  • « LEFT_OF » : à gauche
  • « RIGHT_OF » : à droite (emplacement par défaut)
  • Stratégie de construction de l’empan à jouer :
  • « Word » : à partir de propriétés de mots
  • « Structure » : à partir de propriétés d’une structure
  • « Milestone » : à partir d’une propriété de structure
    voir le détail des stratégies à la section suivante.

7.2.4 Stratégies de construction d’empans de lecture

Ces paramètres sont réglés dans la section « Empan à jouer » des préférences « TXM > Utilisateur > Media PLayer ».

7.2.4.1 Word

L’empan est construit à partir de positions de mots dans l’enregistrement, encodées dans une propriété des mots, du nième mot à gauche au mième mot à droite autour du mot pivot :

  • Propriété de mot de temps : nom de la propriété encodant la position du (début du) mot dans l’enregistrement, « time » par défaut
  • Left length : position du mot dans le contexte gauche du pivot, « 10ème » mot par défaut
  • Right length : position du mot dans le contexte droit du pivot, « 15ème » mot par défaut

7.2.4.2 Structure

L’empan est construit à partir de positions de début et de fin d’une structure dans l’enregistrement :

  • Structure : « sp » (tour de parole) par défaut
  • Propriété codant le temps de départ : « start » par défaut
  • Propriété codant le temps de fin : « end » par défaut

Pour une sélection de mots, TXM utilise la structure qui domine la position du premier mot de la sélection.

7.2.4.3 Milestone

L’empan est construit à partir d’une position de début d’une structure dans l’enregistrement :

  • Structure : « u » (énoncé) par défaut
  • Propriété codant le temps de départ : « start » par défaut

Pour une sélection de mots, TXM utilise le temps de début de la structure qui précède la position du premier mot et le temps de début de la structure qui suit la position du dernier mot de la sélection.

7.2.5 Paramètres de corpus du lecteur multimedia

Le lecteur multimédia utilise certains paramètres de corpus s’ils sont présents.
Ils ont priorité sur les paramètres généraux du lecteur, qui sont modifiables dans la page de préférences.

Pour visualiser les paramètres d’un corpus relatifs au lecteur multimédia :

  1. d’abord sélectionner le corpus dans la vue Corpus
  2. ensuite lancer la commande « Édition > Préférences Média Player » :
    Paramètres de corpus pour le lecteur multimédia.

    Figure 7.5: Paramètres de corpus pour le lecteur multimédia.

    7.2.5 Paramètres généraux

Une première série de paramètres de corpus permet de régler au corpus près les paramètres généraux du lecteur multimédia (voir leur description à la section ??).

Il s’agit des huit premiers paramètres de la figure 7.5.

Le tableau 7.1 liste la correspondance entre ces paramètres de corpus et les paramètres généraux du lecteur multimédia :

Tableau 7.1: Table Correspondance entre les paramètres de corpus pour le lecteur multimédia et les paramètres généraux du lecteur multimédia.
Paramètres de corpus pour le lecteur multimédia Paramètres généraux du lecteur multimédia Valeur par défaut Modifiable
backtomedia_loop Répéter la lecture true oui
backtomedia_startproperty Propriété codant le temps de départ starttime non
backtomedia_endproperty Propriété codant le temps de fin endtime non
backtomedia_structure Structure sp oui
backtomedia_wordtime_property Propriété de mot de temps starttime non
backtomedia_word_context_left_distance Left length 12 oui
backtomedia_word_context_right_distance Right length 17 oui
sync_mode Stratégie de construction de l’empan à jouer Structure oui

Les paramètres de corpus pour le lecteur multimédia ont vocation à être livrés avec le corpus pour une utilisation optimale du lecteur multimédia.

Certains de ces paramètres peuvent être modifiés en fonction des besoins d’utilisation du corpus par l’utilisateur, ils sont marqués par « oui » dans la colonne « Modifiable » :

  • sync_mode
  • backtomedia_word_context_left_distance
  • backtomedia_word_context_right_distance
  • backtomedia_structure
  • backtomedia_loop

Pour modifier leur valeur il suffit de cliquer dans la cellule de valeur et de la modifer, puis enregistrer en cliquant sur « OK ».

Il est recommandé de ne pas modifier les autres paramètres de corpus relatif au lecteur multimédia, au risque que le retour à la vidéo ou à l’audio ne fonctionne plus.

7.2.5.1 Paramètres d’accès aux fichiers médias

Une deuxième série de paramètres de corpus permet de configurer la façon avec laquelle le lecteur multimédia accède aux fichiers médias des transcriptions d’un corpus.

Il s’agit des quatre derniers paramètres de la figure 7.5.

Stratégie d’accès aux fichiers média par défaut

Par défaut, le lecteur multimédia cherche le fichier vidéo ou audio associé à une transcription d’un corpus dans le répertoire $TXMHOME\corpora<identifiant corpus>\media.

Le chemin d’accès à ce répertoire est donc construit à partir de l’identifiant du corpus (<identifiant corpus>).

Le nom du fichier média lui-même est construit à partir de l’identifiant de la transcription, soit <text@id>.<extension>. C’est à dire la valeur de la métadonnée id de la structure text correspondant à la transcription, soit le nom du fichier source de la transcription sans son extension, suivie d’une extension de fichier média.

Selon le type de média, l’<extension> prend la valeur : - « .mp4 » ou « .avi » ou « .mov » pour les fichiers vidéos ; - « .mp3 » ou « .ogg » ou « .wav » pour les fichiers audio.

Le chemin d’accès complet par défaut au fichier média d’une transcription est donc $TXMHOME\corpora<identifiant corpus>\media<text@id>.<extension>.

Il est construit à partir de deux informations :

  • l’identifiant du corpus : <identifiant corpus> ;
  • l’identifiant de la transcription <text@id>.

Configuration de la stratégie d’accès aux fichiers média

Un groupe de paramètres de corpus permet de gérer différentes configurations d’accès aux fichiers média :

  • en désignant un répertoire local précis pour les fichiers média ;
  • en désignant un site web distant hébergeant les fichiers média en ligne avec accès direct ou avec contrôle d’accès par connexion par identifiant/mot de passe.

Ces paramètres sont à régler de façon combinée :

  • media_path_prefix :
    c’est en donnant une valeur à ce paramètre que l’on configure un accès aux fichiers média différent de la stratégie d’accès par défaut. la valeur peut être :
    1. un chemin relatif de répertoire local (à la machine) :
      par exemple mon-corpus\media, les fichiers média utilisés auront le chemin mon-corpus\media<text@id>.<media_extension>
    1. un chemin absolu de répertoire local :
      par exemple C:\Users<identifiant utilisateur>\corpus\mon-corpus\media, les fichiers média utilisés auront le chemin C:\Users<identifiant utilisateur>\corpus\mon-corpus\media<text@id>.<media_extension>
    1. le préfixe d’une adresse47 de site web pour un accès direct à des fichiers média hébergés en ligne :
      par exemple https://mp4studio.ina.fr/lire/, les fichiers média auront le chemin https://mp4studio.ina.fr/lire/<text@id>.<media_extension>
    1. le préfixe d’une adresse de site web pour un accès avec contrôle d’accès, avec connexion par identifiant et mot de passe, à des fichiers média hébergés en ligne :
      dans ce cas :
    • le préfixe doit comprendre deux mots-clés, encadrés d’accolades ({..}) :
    • {0} sera remplacé par l’identifiant de connexion
    • {1} sera remplacé par le mot de passe par exemple https://{0}:{1}@okapi.ina.fr/antract/Media/AF/, les fichiers média auront le chemin https://<identifiant de connexion>:<mot de passe>@okapi.ina.fr/antract/Media/AF/<text@id>.<media_extension>
  • media_auth :
    choix du mode d’accès direct ou avec contrôle d’accès par connexion.
  • la valeur true provoque l’ouverture d’une boite de dialogue de saisie des identifiant et mot de passe de connexion lors du premier accès à un fichier média. dans ce cas, le paramètre media_path_prefix doit être de type d) (voir ci-dessus)
  • la valeur false correspond aux modes d’accès directs : type a), b) et c), aucune boite de dialogue de connexion n’est ouverte
  • media_auth_login : (paramètre optionnel) identifiant de connexion à utiliser dans la boite de dialogue de saisie des identifiant et mot de passe de connexion.
    le champ « identifiant » sera pré-rempli avec la valeur de ce paramètre.
    remarque : les identifiants de connexion étant des éléments de sécurité, il peut être plus sûr de ne pas utiliser ce paramètre dans certains contextes. pour des raisons de sécurité, le mot de passe ne peut pas faire partie des paramètres d’un corpus.
    par contre, il n’est à saisir qu’une seule fois pour l’ensemble de la session TXM (il n’est à saisir que lors de la première demande d’accès à un fichier média).
  • media_extension :
    extension de fichier à utiliser pour les fichiers média.
    par exemple :
  • « .mp4 » pour des fichiers vidéos
  • « .mp3 » pour des fichiers audio

Configurations types

En résumé, voici des exemples de configurations types :

  • accès local à des vidéos

  • media_path_prefix : C:\Users<identifiant utilisateur>\corpus\mon-corpus\media
  • media_auth : false
  • media_auth_login : (vide)
  • media_extension : mp4

  • accès distant sans connexion à des vidéos

  • media_path_prefix : https://mp4studio.ina.fr/lire/
  • media_auth : false
  • media_auth_login : (vide)
  • media_extension : mp4

  • accès distant avec connexion à des vidéos

  • media_path_prefix : https://{0}:{1}@okapi.ina.fr/antract/Media/AF/
  • media_auth : true
  • media_auth_login : <identifiant utilisateur>
  • media_extension : mp4

7.2.6 Création d’un corpus de transcriptions compatible avec l’extension Media Player

Le module d’import « XML Transcriber + CSV » permet de créer des corpus compatibles avec l’extension Media Player.

7.2.6.1 Méthode 1. Ajouter des fichiers média dans les sources du corpus

Il faut d’abord équiper le répertoire des sources avec les fichiers média :

  • créer une répertoire « media » dans le répertoire des sources.
  • y ajouter un fichier média par transcription, en utilisant comme nom de fichier l’identifiant de la transcription (<text@id>) avec une extension média : comme « .mp4 » pour des fichiers vidéos ou « .mp3 » pour des fichiers audio. Par exemple, ajouter le fichier vidéo « transcription01.mp4 » correspondant à la transcription « transcription01.trs ».

À l’exécution du module d’import, le répertoire « media » sera transféré dans le corpus binaire (de chemin $TXMHOME/corpora/<identifiant corpus>/media), ce qui permettra à la stratégie par défaut d’accès aux fichiers média de fonctionner directement.

7.2.6.2 Méthode 2. Ajouter des fichiers média dans le corpus binaire

Si les fichiers média sont trop lourds à manipuler pour l’opération précédente, il est possible de ne pas équiper le répertoire des sources en amont du module d’import.

Dans ce cas on pourra créer soi-même le répertoire $TXMHOME/corpora/<identifiant corpus>/media dans le corpus binaire après import, et y déposer les fichiers médias avec le même format que décrit précédemment.

Pour TXM il n’y aura pas de différence entre des fichiers média copiés depuis les sources et des fichiers médias déposés dans le corpus binaire après import.

7.2.6.3 Méthode 3. Configurer les paramètres d’accès aux fichiers médias du corpus

Si on souhaite utiliser un mode d’accès aux fichiers média différent de la stratégie d’accès par défaut, il suffit de n’importer que les transcriptions avec le module d’import « XML Transcriber + CSV ».

On pourra ensuite modifier les paramètres d’accès aux fichiers médias du corpus créé en suivant les instructions de la section 7.2.5.1 « Paramètres d’accès aux fichiers médias ».

Dans ce cas, quand on exporte le corpus pour le transférer, il faudra bien faire attention à ce que le TXM qui chargera le corpus ai bien accès aux fichiers média au moment de l’utilisation du corpus. Pour un accès distant par site web cela se fera automatiquement.

7.2.7 Corpus exemple P1S8 prêt à l’emploi

TBD

Le corpus exemple P1S8 est directement utilisable avec l’extension Media Player.

  • P1S8 4 avril 2014, transcription et enregistrement d’un cours de physique en Lycée (cours sur la lumière) :

    • charger ’p1s8-bin.txm’ dans TXM
    • ajouter dans le répertoire ’media’ du corpus binaire le fichier ’P1S8 30 avril 2014.mp4’
    • ou bien le fichier ’P1S8 30 avril 2014.mp3’ si on ne souhaite tester que l’audio

Pour des raisons de protection de la vie privée (image, voix, nom et prénom, etc.), seule la partie située entre 0h 30m 26s et 0h 31m 39s du cours est visible et audible et la transcription est entièrement anonymisée. Pour faire un retour à la vidéo utile, il faut donc faire une concordance de mots prononcés dans cet intervalle. Par exemple :

  • Concordance de ’néon’

  • faire un retour au média depuis la 6ième ligne :
    P1S8 30 avril 2014, P, 0:30:49 si vous faites taper la lumière d’un néon sur un CD vous ne verrez pas toutes les couleurs de l’

7.3 Extension Annotation URS

TBD

Voir la section 7.2 Annotation avec un modèle Unité-Relation-Schéma (URS) au fil du texte page 153.

7.4 Extension XML Editor

TBD

L’extension XML Editor ajoute un éditeur de fichiers XML à TXM\[93\].

Cet éditeur se lance actuellement sur un fichier pré-existant sur le disque dur, avec la commande « Fichier / Open XML File… ».

À l’ouverture, le fichier est présenté en mode « Design » ou tabulé, comme dans la figure Illustration.

En cliquant sur l’onglet « Source » on bascule dans le mode syntaxique XML comme dans la figure Illustration.

7.4.1 Services du mode syntaxique XML

7.4.1.1 Repérage au sein de la syntaxe XML

Les différents éléments XML sont présentés avec leur propre couleur : nom des balises, nom d’attributs, valeurs d’attributs, contenu textuel, commentaires, etc.) pour faciliter le repérage ainsi que la détection d’erreurs de syntaxe (par exemple un commentaire XML mal fermé « <!— … –> » provoquera une colorisation particulière d’une large portion du fichier XML). La colorisation est paramétrable dans les préférences de TXM, voir plus bas.

L’enchâssement courant du curseur au sein de la hiérarchie des balises est indiqué par un chemin de fer situé en bas à gauche de la fenêtre d’édition.

Des boutons de fermeture/ouverture (⊖/⊕) situés en début de ligne de chaque balise ouvrante permettent de réduire temporairement tout le contenu de certains éléments XML.

7.4.1.2 Saisie assistée d’éléments XML

En fonction du schéma ou de la DTD éventuelle du fichier, de la position du curseur et de ce qui vient d’être saisi, l’éditeur propose automatiquement de compléter la saisie.

Par exemple :

  • l’ajout de la balise fermante après la saisie d’une balise ouvrante ;

  • l’ajout du guillemet fermant une valeur d’attribut ;

  • la complétion du nom d’une balise fermante ;

  • etc.

Le copier/coller d’éléments XML est accéléré par un double-clic adapté :

  • 1 double-clic = sélection de la totalité d’une valeur d’attribut ;

  • 2 double-clics = sélection du nom de l’attribut et de sa valeur ;

  • 3 double-clics = sélection de l’ensemble de la balise.

L’éditeur gère un jeu de patrons récurrents de balises à insérer rapidement.

7.4.1.3 Formatage automatique

L’éditeur peut :

  • indenter automatiquement les balises de l’ensemble du document ou seule une portion sélectionnée → commande « Source > Format » du menu contextuel ;

  • « nettoyer le document » pour une correction automatique de la syntaxe XML → commande « Source > Cleanup Document… » du menu contextuel.

7.4.1.4 Validation de la syntaxe

Commande « Validate » du menu contextuel (à décrire).

7.4.2 Gestion des déclarations XML

7.4.2.1 Association d’une DTD à un fichier XML

Il est possible, mais pas nécessaire, d’associer une DTD au fichier en cours d’édition.

Dans un fichier XML, la déclaration suivante :

<!DOCTYPE balise-racine PUBLIC “IdDoc” “C:\mesdtd\Doc.dtd”>

associera la DTD d’identifiant public « IdDoc » au fichier.

Le chemin d’accès au fichier de DTD est obtenu par le biais du catalogue XML s’il définit l’identifiant « IdDoc » ou directement à partir de la déclaration du chemin d’accès « C:\mesdtd\Doc.dtd ».

On peut également réaliser l’association avec la déclaration suivante :

<!DOCTYPE balise-racine SYSTEM “IdDoc.dtd”>

associant la DTD d’identifiant système « IdDoc.dtd » au fichier. L’identifiant système « IdDoc.dtd » doit alors être déclaré dans le catalogue XML.

7.4.2.2 Association d’un schéma à un fichier XML

Dans un fichier XML, la déclaration suivante :

<document

xmlns=“http://txm.org

xsi:schemaLocation=“http://textometrie.org C:\messchemas\document.xsd”>
<corps>

indiquera le chemin d’accès au fichier de schéma XML directement au processeur XML par le biais de l’attribut xsi:schemaLocation.

On peut également réaliser l’association avec la déclaration suivante :

<document

xmlns=“http://txm.org

xsi:schemaLocation=“http://textometrie.org document.xsd”>
<corps>

associant le schéma d’identifiant système « document.xsd » au fichier. L’identifiant système « document.xsd » doit alors être déclaré dans le catalogue XML.

7.4.2.3 Accès distant aux DTD et schéma XML

Dans le cas d’une déclaration distante comme :

<!DOCTYPE balise-racine PUBLIC “IdDoc” “http://textometrie.org/xml/catalog/dtd/Doc.dtd”>

Si vous êtes connecté à Internet par le biais d’un pare-feu et que vous ne pouvez pas établir votre configuration SOCKS, vous devez télécharger les fichiers vous-même et les installer sur votre machine, puis utiliser des déclarations locales.

7.4.2.4 Resynchronisation de l’éditeur XML après une mise à jour du catalogue XML

Après avoir édité des entrées dans le catalogue XML, vous pouvez avoir à resynchroniser l’éditeur XML avec la nouvelle version du catalogue en utilisant le bouton « Reload Dependencies » de la barre d’outils.

7.4.3 Paramétrage de la colorisation des balises XML

Il est possible de régler le style d’affichage des différents types d’éléments XML par le biais des préférences « XML > XML Files > Editor > Syntax coloring ». Pour chaque type d’élément, il est possible de choisir sa couleur d’affichage, celle de son arrière plan ainsi que sa mise en gras éventuelle. Pour rétablir le style par défaut d’un type d’élément, on peut le sélectionner dans le champ « Syntax Element » et cliquer sur « Restorer \[au style par\] défaut ».

Friedl, Jeffrey E. F. 2002. Mastering Regular Expressions, Second Edition. Second edition. Beijing ; Sebastopol, CA: O’Reilly Media.


  1. Le début du blocus de Berlin, Les Actualités Françaises, 15 juillet 1948, INA.

  2. une URL : Uniform Ressource Locator.