SATO 4.4, Manuel de référence (mars 2007)
Table des matières | Définitions
Poste Extraction
... désigne le fichier en format texte sur lequel peuvent être déposés divers résultats produits par SATO. Généralement, il s'agit de résultats de calculs statistiques. C'est pour cette raison que le suffixe implicite de ce fichier est «.sta». EXTRACTION désigne le fichier d'extraction mais aussi le comportement du dispositif d'extraction.

Il y a deux façons d'inscrire des résultats dans le fichier d'extraction. La première façon est d'utiliser la commande COMPTAGE (cf. ANALYSEUR COMPTAGE). La deuxième façon est de désigner nommément certains résultats produits par des commandes SATO comme objets à extraire (cf. CARACTÉRISER PRÉSENCE).
Exploration :
AFFICHER
EXPORTER
Exploitation :
COMMENTER
Gestion :
SUPPRIMER
Configuration :
CARACTÉRISER { DÉLIMITEUR | FICHIER | PRÉSENCE }

Afficher
Syntaxe :
POSTE EXTRACTION AFFICHER

AFFICHER permet d'afficher à l'écran le contenu du fichier d'extraction. Il ne s'agit pas à proprement parler d'une commande SATO mais plutôt d'un appel à la fonction d'affichage de fichier du bureau. L'utilisateur aura à choisir un fichier parmi la liste de ses fichiers portant l'extension .sta (statistique).


Commenter
Syntaxe :
POSTE EXTRACTION COMMENTER texte

COMMENTER permet d'inscrire un commentaire dans le fichier d'extraction.

Le paramètre texte désigne le contenu du commentaire.


Caractériser

CARACTÉRISER permet de modifier les attributs de l'écran. Plusieurs traits rattachés à l'apparition des résultats à l'écran peuvent ainsi être ajustés selon les besoins de l'usager. Ce sont : DÉLIMITEUR, FICHIER et PRÉSENCE.


Caractériser Délimiteur
Syntaxe :
POSTE EXTRACTION CARACTÉRISER DÉLIMITEUR {?|?? variable|= POINT-VIRGULE|= TABULATION}

Le trait DÉLIMITEUR permet de choisir le caractère qui servira à séparer les champs dans le fichier d'extraction.

Le paramètre POINT-VIRGULE indique que le caractère «;» sera utilisé comme séparateur de champ alors que paramètre TABULATION indique que le caractère de tabulation servira à délimiter les champs. C'est la valeur implicite du trait.

L'opérateur ? provoque l'affichage de la valeur du trait. L'opérateur ?? indique que le contenu du trait sera copié dans une variable pour une utilisation future. Le paramètre variable contient le numéro de la variable.


Caractériser Fichier
Syntaxe :
POSTE EXTRACTION CARACTÉRISER FICHIER {?|?? variable|= fichier [AJOUT]}

Le trait FICHIER est utilisé pour définir un nouveau fichier d'extraction. Le paramètre fichier est le nom du nouveau fichier d'extraction (avec suffixe «.sta» recommandé).

Le paramètre optionnel AJOUT indique que l'on veut écrire à la fin du fichier d'extraction plutôt que d'écraser l'ancien contenu du fichier. Le fichier d'extraction est écrit avec l'encodage UTF-8.

L'opérateur ? provoque l'affichage de la valeur du trait. L'opérateur ?? indique que le contenu du trait sera copié dans une variable pour une utilisation future. Le paramètre variable contient le numéro de la variable.


Caractériser Présence
Syntaxe :
POSTE EXTRACTION CARACTÉRISER PRÉSENCE {?|?? variable|numéro de l'objet = OUI|numéro de l'objet = NON}

Il peut s'avérer utile d'extraire certains résultats de commandes SATO pour les inscrire dans le fichier d'extraction. Ces résultats, généralement de nature numérique, pourraient par la suite être repris par des logiciels d'analyse statistique. Nous avons identifié dans SATO un certain nombre de champs susceptibles d'avoir cet intérêt. Ces champs sont identifiés par un numéro unique. Le trait PRÉSENCE suivi du numéro de l'objet et des mots NON ou OUI permet de désactiver ou d'activer l'extraction d'un objet. Implicitement, la valeur de présence est à NON pour l'ensemble des objets.

Voici une liste approximative des objets que l'on peut extraire :

1 : Nombre de contextes (cf. CONTEXTE APPLIQUER);
2 : Nombre de mots;
3 : Longueur moyenne des phrases;
4 : Longueur moyenne des paragraphes;
5 : Pourcentage de mots de 9 caractères et plus;
6 : Indice de Gunning (cf. ANALYSEUR LISIBILITÉ;)
7 : Pourcentage d'occurrences;
8 : Nombre de segments (cf. ANALYSEUR SEGMENTATION);
9 : Nombre de lexèmes;
10 : Nombre d'occurrences;
11 : Pourcentage de lexèmes (cf. ANALYSEUR PARTICIPATION).

Comme cette liste d'objets est susceptible d'être augmentée avec le temps, il est possible de voir si un résultat affiché à l'écran peut être extrait en posant le curseur de la souris sur le résultat. Dans ce cas, un navigateur récent devrait afficher une petite boîte indiquant le numéro de la variable précédé de la lettre R (pour Référence...), par exemple R6 pour l'indice Gunning.

L'opérateur ? provoque l'affichage de la valeur du trait. L'opérateur ?? indique que le contenu du trait sera copié dans une variable pour une utilisation future. Le paramètre variable contient le numéro de la variable.


Exporter
Syntaxe :
POSTE EXTRACTION EXPORTER

EXPORTER permet de copier dans le fichier d'exportation le contenu du fichier d'extraction. Cette commande ne requiert aucun paramètre.


Supprimer
Syntaxe :
POSTE EXTRACTION SUPPRIMER

SUPPRIMER permet de vider le contenu du fichier d'extraction. Cette commande ne requiert aucun paramètre.