12 Syntaxe des requêtes CQL
12.4 Recherche d'un motif de plusieurs mots [niveau 3 (supralexical) : séquences d'unités lexicales]
12.4.1 Succession de mots
[word="réduction"] [word="du"] [word="temps"] [word="de"] [word="travail"] |
Paire de crochets = mot. |
"réduction" "du" "temps" "de" "travail" [frlemma="réduction"] "du" "temps" "de" "travail" |
Notation allégée possible si l'on ne travaille que sur des graphies. Mélange possible. |
[frpos="NOM"][frlemma="de"][frpos="NOM"] |
Usage avec des catégories (patron). |
[frpos="NOM"][frlemma="de"][frlemma="le"]?[frpos="NOM"]
[frpos="NOM"]([frlemma="de"][frlemma="le"]|[frlemma="du"])[frpos="NOM"]
[frpos="DET.*"][frpos="ADV"]?[frpos="ADJ"]+ [frlemma="année"]
On retrouve à ce niveau 3 les opérateurs vus au niveau 1, pour gérer les variations.
12.4.2 Traitement des insertions
[frlemma="il"][][frlemma="y"][frlemma="avoir"] |
Une unité lexicale quelconque (joker de mot). |
[frlemma="il"][]?[frlemma="y"][frlemma="avoir"] |
Insertion facultative. |
[frlemma="il"][][][][frlemma="y"][frlemma="avoir"] |
Distance de trois unités lexicales. |
[frlemma="il"][]{0,3}[frlemma="y"][frlemma="avoir"] |
Distance de zéro à trois. |
[frlemma="paix"][]{0,10}[frlemma="monde"] [frlemma="paix"][]*[frlemma="monde"] within 10 |
Distance de 0 à 10, deux formulations équivalentes. |
Si l'on utilise []* il faut absolument borner l'expansion.
[frlemma="je"][frpos!="V.*"]*[frlemma="souhaiter"][frpos!="V.*"]*[frlemma="année"] within 25
Distances avec mots exclus, contrôle davantage syntaxique.
[lemma="je"][pos!="V.*"]*[lemma="souhaiter"][pos!="V.*"]*[lemma="année"] within s
(dans Discours) Empan sur structure (si disponible)
[lemma="République"][]*[lemma="France"] within 2s |
(dans Discours) Structure multipliée. |
12.4.3 Étude distributionnelle
[frlemma="très"][] |
On prend un motif (contexte), et on rend variable une place, soit complètement librement, |
[frpos="NOM"][frlemma="français"] |
soit avec une indication de catégorie. |
[frlemma="ne"][frpos="VER.*"] |
Recherche des verbes avec négation. |
[frlemma="ne"]([frpos!="VER.*|NOM|ADJ"]|[frlemma="être|avoir"])*[frpos="VER.*" & frlemma!="être|avoir"] within 10
Idem, plus affinée.
12.4.4 Alternatives
([word="président"%c][][][word="république"%c]|[word="chef"%c][][][word="état"%cd])
Expressions.
([frlemma="paix"][]*[frlemma="monde"]|[frlemma="monde"][]*[frlemma="paix"]) within 10
([frlemma="travail.*"][]*[frlemma="famil.*"]|[frlemma="famil.*"][]*[frlemma="travail.*"]) within 20
Cooccurrences.
12.4.5 Lien entre deux mots
a:[frpos="NAM|NOM|ADJ|VER.*" & word!=".*\p{P}"][]*[word=a.word] within 10
Répétition, accord,...