SATO 4.4, Manuel de référence (mars 2007)
Table des matières | Définitions
Dictionnaire séquentiel
... est un dictionnaire à champ unique en format compressé. Un tel dictionnaire permet d'associer des valeurs de propriété à des chaînes de caractères qui correspondent à des formes lexicales.
Exploration :
AFFICHER
EXPORTER
DÉCRIRE
Exploitation :
APPLIQUER
ATTRIBUER

Librairie de dictionnaires

Exemples :
Exemple 1 - Dictionnaire séquentiel afficher
Exemple 2 - Dictionnaire séquentiel appliquer
Exemple 3 - Dictionnaire séquentiel attribuer

Librairie de dictionnaires

En plus des dictionnaires personnels de l'usager, divers dictionnaires peuvent faire partie d'une librairie commune. Normalement, ces dictionnaires sont manipulés par des scénarios communs. Il n'est donc pas conseillé de les appliquer directement. Voici une description des dictionnaires développés au Centre ATO pour l'annotation de lexiques en français.


Afficher
Syntaxe :
DICTIONNAIRE SÉQUENTIEL AFFICHER fichier filtre [DÉFINITION]

AFFICHER est l'opération qui permet d'afficher à l'écran le contenu d'un dictionnaire.

Le paramètre fichier désigne le nom du fichier dictionnaire. SATO assume que le fichier porte le suffixe «.dic».

Le filtre est un patron de fouille qui permet de définir les entrées du dictionnaire que l'on veut afficher. Sa valeur implicite est «$» (tous les mots).

La clé facultative DÉFINITION permet d'afficher la définition du champ en plus des valeurs.

Voir : Exemple 1 - Dictionnaire séquentiel afficher.


Appliquer
Syntaxe :
DICTIONNAIRE SÉQUENTIEL APPLIQUER fichier PROPRIÉTÉ propriété POUR filtre [AJOUTER|RETIRER]

APPLIQUER permet de consulter un dictionnaire et de transférer l'information qu'il contient dans une propriété lexicale déjà définie. La définition de la propriété doit être compatible avec celle du dictionnaire.

Le paramètre fichier désigne le nom du fichier dictionnaire. SATO assume que le fichier porte le suffixe «.dic».

Le mot PROPRIÉTÉ suivi d'un nom de propriété désigne la propriété lexicale qui va recevoir les valeurs trouvées dans le dictionnaire.

Le paramètre filtre (valeur implicite «$») permet de sélectionner les entrées lexicales qui seront fouillées dans le dictionnaire.

Normalement, l'attribution de valeurs à une propriété à partir du dictionnaire se fait par remplacement de l'ancienne valeur. L'option AJOUTER indique que les valeurs trouvées seront plutôt ajoutées aux valeurs existantes. À l'inverse, l'option RETIRER indique que les valeurs trouvées seront retirées de la propriété (cf. Dictionnaire : Algorithme).

Voir : Exemple 2 - Dictionnaire séquentiel appliquer.


Attribuer
Syntaxe :
DICTIONNAIRE SÉQUENTIEL ATTRIBUER fichier PROPRIÉTÉ propriété POUR filtre

L'action ATTRIBUER permet de créer un dictionnaire séquentiel, et de lui attribuer des valeurs, à partir d'une propriété lexicale. Le champ implicite défini dans le dictionnaire correspond à la définition de la propriété.

Le paramètre fichier désigne le nom du fichier dictionnaire. SATO assume que le fichier porte le suffixe «.dic». Un nom de fichier devrait être composé de lettres minuscules sans accents, de chiffres et des caractères «-» et «_». Il ne doit pas contenir d'espaces et ne doit pas débuter par «-».

Le mot PROPRIÉTÉ suivi d'un nom de propriété désigne la propriété lexicale dont les valeurs seront inscrites dans le dictionnaire.

Le paramètre filtre (valeur implicite «$») permet de sélectionner les entrées lexicales qui seront inscrites dans le dictionnaire.

Voir : Exemple 3 - Dictionnaire séquentiel attribuer.


Décrire
Syntaxe :
DICTIONNAIRE SÉQUENTIEL DÉCRIRE fichier

DÉCRIRE fournit une description du contenu du dictionnaire.

Le paramètre fichier désigne le nom du fichier dictionnaire. SATO assume que le fichier porte le suffixe «.dic».

Syntaxe :
DICTIONNAIRE SÉQUENTIEL DÉCRIRE fichier filtre

DÉCRIRE fournit une description du contenu du dictionnaire. Le type de description fournie dépend du type de la propriété qui a servi à construire le dictionnaire. La description débute par la définition du champ. Un champ entier se traduit par le calcul de la moyenne et de l'écart type. Un champ symbolique entraîne le décompte de la fréquence absolue et relative de chaque symbole. Dans tous les cas la description se termine par le décompte du nombre d'entrées lues et trouvées.

Le filtre est un patron de fouille qui permet de définir les entrées du dictionnaire que l'on veut décrire. Sa valeur implicite est «$» (tous les mots).


Exporter
Syntaxe :
DICTIONNAIRE SÉQUENTIEL EXPORTER fichier filtre [DÉFINITION]

EXPORTER permet d'enregistrer le contenu du dictionnaire sur le fichier de listage.

Voir : AFFICHER pour l'explication des paramètres et du fonctionnement de la commande.

Exemple: Afficher

Exemple 1. Exemple d'affichage d'un dictionnaire séquentiel.
Les entrées du dictionnaire «..\lib\art.dic» débutant par «a» sont affichés. La définition du dictionnaire est également affichée.

DICTIONNAIRE SÉQUENTIEL AFFICHER ..\lib\art.dic a$ DEFINITION
champ Art symbolique Artdéffp Artdéffs Artdéfmp Artdéfms Artindfp Artindfs Artindmp Artindms Artparfp Artparfs Artparmp Artparms

au*Art=Artdéfms
aux*Art=(Artdéffp,Artdéfmp)

nombre d'entrées lues, trouvées, écrites: 10, 2, 0

Voir la commande : AFFICHER


Exemple: Appliquer

Exemple 2. Exemple d'application d'un dictionnaire séquentiel.
On applique le dictionnaire «..\lib\gramr.dic» sur tous les mots du lexique dont la valeur de la propriété lexicale «gramr» est «nil», c'est-à-dire ne possédant pas de valeur pour cette propriété. Il faut noter que la propriété lexicale symbolique «gramr» doit avoir été créée au préalable. Deux résultats numériques sont présentés : le premier nombre indique le nombre de formes lexicales lues dans le dictionnaire tandis que le second donne le nombre de formes appartenant au lexique du texte et qui ont trouvé leur équivalent dans le dictionnaire. La commande LEXIQUE AFFICHER affiche le résultat pour les entrées débutant par «a».

DICTIONNAIRE SÉQUENTIEL APPLIQUER ..\lib\gramr.dic propriété Gramr POUR $*gramr=nil
nombre d'entrées lues, trouvées, écrites: 299252, 162, 0

LEXIQUE AFFICHER a$ TRI Alphabet

Fréqtot   Gramr

1         (Vaux,Vconj)                        a

1         Vparpas                             alléché

1         Nomcom                              ambassadeurs

1         (Adjqua,Nomcom)                     animal

1         Vconj                               apprenez

1         Vconj                               approchez

1         Nomcom                              arbre

1         Adv                                 assez

1         (Adv,Con)                           aussi

1         Artdéf                              aux

1         (Nomcom,Vinf)                       avoir



Nombre de lexèmes écrits: 11

Voir la commande : APPLIQUER


Exemple: Attribuer

Exemple 3. Exemple d'attribution de valeurs à un dictionnaire séquentiel.
On peut définir un dictionnaire séquentiel à partir d'un lexique catégorisé. Dans l'exemple qui suit, on présume que l'on a défini une propriété lexicale «gramr» sur les fables de La Fontaine. Aussi, si l'on a attribué la valeur «Adjqua» aux adjectifs qualificatifs présents dans le lexique des fables, la commande suivante permettra de conserver cette catégorisation dans le dictionnaire séquentiel «adjectif.dic». La commande affichera quelques statistiques.

DICTIONNAIRE SÉQUENTIEL ATTRIBUER adjectif PROPRIÉTÉ gramr POUR $*gramr=Adjqua
Nombre de formes lues, trouvées, écrites : 0, 0, 24

Voir la commande : ATTRIBUER