12 Syntaxe des requêtes CQL

12.4 Recherche d'un motif de plusieurs mots [niveau 3 (supralexical) : séquences d'unités lexicales]

12.4.1 Succession de mots

[word="réduction"] [word="du"] [word="temps"] [word="de"] [word="travail"]

Paire de crochets = mot.

"réduction" "du" "temps" "de" "travail"

[frlemma="réduction"] "du" "temps" "de" "travail"

Notation allégée possible si l'on ne travaille que sur des graphies. Mélange possible.

[frpos="NOM"][frlemma="de"][frpos="NOM"]

Usage avec des catégories (patron).

[frpos="NOM"][frlemma="de"][frlemma="le"]?[frpos="NOM"]

[frpos="NOM"]([frlemma="de"][frlemma="le"]|[frlemma="du"])[frpos="NOM"]

[frpos="DET.*"][frpos="ADV"]?[frpos="ADJ"]+ [frlemma="année"]

On retrouve à ce niveau 3 les opérateurs vus au niveau 1, pour gérer les variations.

12.4.2 Traitement des insertions

[frlemma="il"][][frlemma="y"][frlemma="avoir"]

Une unité lexicale quelconque (joker de mot).

[frlemma="il"][]?[frlemma="y"][frlemma="avoir"]

Insertion facultative.

[frlemma="il"][][][][frlemma="y"][frlemma="avoir"]

Distance de trois unités lexicales.

[frlemma="il"][]{0,3}[frlemma="y"][frlemma="avoir"]

Distance de zéro à trois.

[frlemma="paix"][]{0,10}[frlemma="monde"]

[frlemma="paix"][]*[frlemma="monde"] within 10

Distance de 0 à 10, deux formulations équivalentes.

Si l'on utilise []* il faut absolument borner l'expansion.

[frlemma="je"][frpos!="V.*"]*[frlemma="souhaiter"][frpos!="V.*"]*[frlemma="année"] within 25

Distances avec mots exclus, contrôle davantage syntaxique.

[lemma="je"][pos!="V.*"]*[lemma="souhaiter"][pos!="V.*"]*[lemma="année"] within s

(dans Discours) Empan sur structure (si disponible)

[lemma="République"][]*[lemma="France"] within 2s

(dans Discours) Structure multipliée.

12.4.3 Étude distributionnelle

[frlemma="très"][]

On prend un motif (contexte), et on rend variable une place, soit complètement librement,

[frpos="NOM"][frlemma="français"]

soit avec une indication de catégorie.

[frlemma="ne"][frpos="VER.*"]

Recherche des verbes avec négation.

[frlemma="ne"]([frpos!="VER.*|NOM|ADJ"]|[frlemma="être|avoir"])*[frpos="VER.*" & frlemma!="être|avoir"] within 10

Idem, plus affinée.

12.4.4 Alternatives

([word="président"%c][][][word="république"%c]|[word="chef"%c][][][word="état"%cd])

Expressions.

([frlemma="paix"][]*[frlemma="monde"]|[frlemma="monde"][]*[frlemma="paix"]) within 10

([frlemma="travail.*"][]*[frlemma="famil.*"]|[frlemma="famil.*"][]*[frlemma="travail.*"]) within 20

Cooccurrences.

12.4.5 Lien entre deux mots

a:[frpos="NAM|NOM|ADJ|VER.*" & word!=".*\p{P}"][]*[word=a.word] within 10

Répétition, accord,...