SATO 4.4, Manuel de référence (mars 2007)
Table des matières | Définitions
Lexique
Le LEXIQUE correspond à la dimension hors contexte des mots. C'est l'axe lexical de la représentation du corpus dans le plan lexique/occurrences.
Exploration :
AFFICHER
EXPORTER
DÉCRIRE
Configuration :
CARACTÉRISER { PRÉSENTATION | SOMMATION | SOUS-LEXIQUE }

Exemples :
Exemples 1, 2 et 3 - Lexique afficher
Exemple 4 - Lexique décrire

Afficher
Syntaxe :
LEXIQUE AFFICHER filtre TRI nom-de-propriété

AFFICHER affiche à l'écran une sélection du lexique.

La commande AFFICHER entraîne l'affichage des formes lexicales satisfaisant au patron de fouille défini par filtre (dont la valeur implicite $ sélectionne toutes les formes lexicales).

Pour la commande LEXIQUE, des opérateurs spéciaux *< et *> s'ajoutent à la syntaxe régulière du filtre. Ainsi, l'opérateur *> indique que l'on veut sélectionner le premier lexème désigné et les suivants dans l'ordre alphabétique. Par exemple, le*> désigne les lexèmes le, leçon, etc. À l'inverse, le*< sélectionne le et les entrées lexicales situées avant le dans l'ordre alphabétique.

Le mot TRI suivi du paramètre nom-de-propriété désigne le nom d'une propriété lexicale. Le lexique sera trié selon l'ordre des valeurs de cette propriété : ordre ascendant pour la propriété alphabet et ordre descendant pour les autres. Par exemple:

Voir : Exemples 1, 2 et 3 - Lexique afficher.

La commande LEXIQUE CARACTÉRISER SOMMATION = OUI provoque l'affichage ou l'exportation de lignes supplémentaires contenant les sommations des propriétés numériques selon les valeurs communes de la propriété triée.


Exporter
Syntaxe :
LEXIQUE EXPORTER filtre TRI nom-de-propriété

EXPORTER écrit dans le fichier d'exportation une sélection du lexique.

Voir : AFFICHER pour l'explication des paramètres et du fonctionnement de la commande.

Décrire
Syntaxe :
LEXIQUE DÉCRIRE

DÉCRIRE le lexique provoque l'affichage d'un certain nombre d'informations générales sur le corpus:

Voir : Exemple 4 - Lexique décrire.


Caractériser

CARACTÉRISER permet de modifier certains traits associés au lexique : CARACTÉRISER PRÉSENTATION, CARACTÉRISER SOMMATION et CARACTÉRISER SOUS-LEXIQUE.


Caractériser Présentation

Syntaxe :
LEXIQUE CARACTÉRISER PRÉSENTATION {?|?? variable|+ propriété|- propriété|= propriété}

Le trait PRÉSENTATION permet de sélectionner les propriétés qui devront accompagner le lexique lorsqu'on en demande l'affichage ou l'exportation.

Les opérateurs «+» et «-» indiquent que l'on veut ajouter ou retrancher des propriétés à la liste de présentation existante. L'opérateur «=» signifie que les propriétés indiquées remplaceront la liste existante.

Le paramètre propriété désigne le nom d'une propriété lexicale à inclure ou à exclure de la liste de présentation. Ce paramètre peut être répété et il est facultatif.

Si on procède à une sauvegarde (cf. QUITTER SAUVEGARDE ou PROPRIÉTÉ SAUVEGARDER), cette spécification sera conservée d'une session de travail à l'autre.

L'opérateur ? provoque l'affichage la valeur du trait sélectionné. L'opérateur ?? indique que le contenu du trait sera copié dans une variable pour une utilisation future. Le paramètre variable contient le numéro de la variable.


Caractériser Sommation

Syntaxe :
LEXIQUE CARACTÉRISER SOMMATION {?|?? variable|= OUI|= NON}

Le trait SOMMATION sert à activer (OUI) ou à inhiber (NON) le regroupement et la sommation du lexique.

La sommation s'effectue sur l'ensemble des propriétés entières pour le lexique qui font partie de la liste de présentation. Les éléments qui seront sommés sont l'ensemble des entrées lexicales sélectionnées qui possèdent une même valeur de tri. La sommation dépend donc directement du tri choisi pour l'affichage ou l'exportation du lexique. Un tri alphabétique entraîne la sommation des lexèmes qui possèdent une graphie identique. Un tri par la propriété «Fréqtot» entraîne une sommation sur les entrées lexicales qui possèdent des fréquences identiques, etc.

L'opérateur ? provoque l'affichage la valeur du trait sélectionné. L'opérateur ?? indique que le contenu du trait sera copié dans une variable pour une utilisation future. Le paramètre variable contient le numéro de la variable.


Caractériser Sous-Lexique

Syntaxe :
LEXIQUE CARACTÉRISER SOUS-LEXIQUE {?|?? variable|= filtre}

Le trait SOUS-LEXIQUE permet de désigner comme lexique courant un sous-ensemble quelconque du lexique total. Cette restriction peut être utile si on doit faire appel à un scénario d'analyse lexicale que l'on veut appliquer à une partie seulement du lexique. Par exemple, si on a un texte en plusieurs langues, on voudra n'appliquer un scénario de catégorisation grammaticale français qu'à la partie française du texte.

Le patron de fouille filtre permet de désigner les formes lexicales qui feront partie du sous-lexique. Le filtre «$» a pour effet d'annuler le sous-lexique puisqu'il désigne le lexique complet.

Il est à noter qu'une restriction au lexique entraînera une restriction au texte en excluant toutes les occurrences des formes lexicales qui ne font pas partie du sous-lexique.

L'opérateur ? provoque l'affichage la valeur du trait sélectionné. L'opérateur ?? indique que le contenu du trait sera copié dans une variable pour une utilisation future. Le paramètre variable contient le numéro de la variable.


Exemple: Afficher

Exemple 1. Affichage des formes lexicales débutant par «au» ou «av» (corpus «fables»). Le lexique est trié par ordre alphabétique des lexèmes.

LEXIQUE AFFICHER a(u,v)$ TRI alphabet
alphabetfréqtot 
fr1aussi
fr1aux
fr1avoir

Exemple 2. Affichage des formes lexicales dont la fréquence totale est supérieure à 4 (corpus «fables»). Le lexique est trié par ordre alphabétique des lexèmes.

LEXIQUE AFFICHER $*fréqtot>4 TRI alphabet
alphabetfréqtot 
fr5de
fr5en
fr6et
fr8le
fr5qui
fr6tout
fr7un
fr12.
fr24,
fr6:

Exemple 3. Affichage des formes lexicales dont la fréquence totale est supérieure à 4 (corpus «fables»). Le lexique est trié par ordre décroissant des valeurs de la propriété «fréqtot».

LEXIQUE AFFICHER $*fréqtot>4 TRI fréq
alphabetfréqtot 
fr24,
fr12.
fr8le
fr7un
fr6et
fr6tout
fr6:
fr5de
fr5en
fr5qui

Voir la commande : LEXIQUE AFFICHER



Exemple: Décrire

Exemple 4. Description du lexique (corpus «fables»). Cette description comprend la définition des divers alphabets et la section information fournie lors de la soumission du corpus. On trouve aussi le nombre de formes lexicales et la longueur du lexique en nombre de caractères.

LEXIQUE DÉCRIRE
Alphabet fr ,0 .0 ,1 .1 ,2 .2 ,3 .3 ,4 .4 ,5 .5 ,6 .6 ,7 .7 ,8 .8 ,9 .9 '_ **
aujourd' presqu'île presqu'ile 's *séparateur - , : ; . ? ¿ ! ... &#2056; < **
 > ( ) [ ] { } « » % $ £ ¢ ¥ # " @ & + = / \ | * ÷ ± ® ­ ¦ *terminal ' ´ ª º

Information Corpus de démonstration

Nombre de formes lexicales: 165

Voir la commande : LEXIQUE DÉCRIRE