SATO-4 Système d'Analyse de Texte par Ordinateur
Auteur : François Daoust
Les usages pratiques
SATO est un Système d'Analyse de Textes
par Ordinateur utilisé sur des plates-formes
informatiques de type IBM-PC et compatibles. Ce système est
dédié à l'analyse du contenu des documents
conservés sur support informatique.
Avec l'utilisation de SATO, la notion d'analyse de
contenu des textes recouvre une variété de
significations. En voici quelques exemples:
Pour le Spécialiste en éducation,
SATO est utilisé comme outil pour le calibrage des textes
ou documents pédagogiques;
Pour le Chargé de projet au
Ministère de l'environnement du Québec, SATO
facilite l'analyse de 5000 pages contenant les
éléments de l'analyse des caratéristiques de
projets de développement environnemental;
Pour l'Analyste au Secrétariat du
Conseil du trésor du gouvernement du Québec, SATO
permet de retrouver ou d'indexer les éléments
définissant les paramètres de l'attribution des
contrats; il sert aussi de support informatique pour l'indexation
de milliers de pages de conventions collectives de travail;
Pour le Journaliste, SATO permet de retracer
une information écrite ou vérifier le style ou la
lisibilité de ses textes;
Pour le Sociologue, SATO assure
fidélité, rigueur et systématicité
dans les tâches de repérage des
éléments thématiques ou socio-linguistiques
des archives historiques;
Pour le Psychologue, SATO permet l'analyse
comparative du matériel d'entretien
thérapeutique;
Pour le Travailleur Social, SATO est un
adjuvant idéal pour l'analyse des 2000 pages d'un corpus
d'entretiens non-directifs;
Pour le Professionnel de Recherche, SATO
garantit une analyse fiable et rapide des 3000 fiches
bibliographiques télé-déchargées d'un
serveur d'information bibliographique;
Pour le Terminologue, SATO est utilisé
pour l'analyse des contextes définitoires dans des
documents multilingues;
Pour le Linguiste, SATO est utilisé
pour analyser le fonctionnement de la langue dans son aspect
lexical ou dans sa dimension syntagmatique;
Pour le Juriste, SATO permet l'indexation d'un
corpus jurisprudentiel ou d'un document de refonte comme, par
exemple, le Code Civil québécois.
En fait, toutes ces applications ont en commun trois
caractéristiques :
- le volume des données textuelles,
- la diversité de structures, de formats et styles des
données textuelles,
- la variété et la diversité des
opérations d'analyse mises en oeuvre.
Il faut donc pouvoir disposer d'un outil qui permet
un accès rapide et la liberté de considérer le
texte en format intégral augmenté, si nécessaire,
de divers niveaux de description. SATO est précisément
développé pour satisfaire ce type de besoin.
Résumé des caractéristiques de SATO
En résumé, SATO est un système
destiné à soutenir une variété
d'activités d'analyse de données textuelles. Il permet
l'annotation de documents multilingues, le repérage sur
mesure des éléments du texte et l'analyse
qualitative ou quantitative du document ou de ses parties. Pour ce
faire, SATO offre les fonctionnalités suivantes (pour ne nommer
que les plus importantes) :
un langage de requête assurant le
repérage systématique de segments textuels
définis par l'utilisateur au moment de la
requête;
le repérage de contextes par des
patrons de concordance d'une grande
flexibilité; ce repérage permet aussi la production
d'index aussi précis que désirés;
la constitution d'inventaires lexicaux
triés alphabétiquement ou numériquement, ou
selon tout autre système de description;
la catégorisation de mots, de
mots-composés ou de locutions;
la définition de variables pour effectuer
des dénombrements multiples et analyses
lexicométriques;
des fonctions pour constituer et mettre à
jour des dictionnaires avec, si nécessaire, des
dispositifs pour la dérivation morphologique;
la gestion des formats d'affichage;
l'importation et l'exportation de fichiers ASCII;
un indice de lisibilité (GUNNING);
un mode assisté de mise au point de
scénarios automatiques (fichiers de commandes SATO).
Distribution
Le logiciel SATO est distribué par le Centre
d'analyse de texte par ordinateur (ATO) de la Faculté des sciences humaines à l'Université du
Québec à Montréal. Le Centre ATO est un centre
d'expertise et de consultation qui se consacre à l'analyse des
textes au moyen de l'ordinateur et au traitement des langues
naturelles, du français en particulier.
Centre d'analyse de texte par ordinateur
Université du Québec à Montréal
C.P. 8888, succ. Centre-Ville
Montréal (Québec)
CANADA, H3C 3P8
Tél.: (514) 987-3000 poste 4360
Courrier électronique : daoust.francois@uqam.ca
La version de SATO disponible actuellement en usage libre sur ce site peut aussi être achetée. Elle tourne sur technologie Windows. L'interface complet nécessite l'installation d'un serveur WEB et d'un interpréteur Perl. La license laboratoire peut être installée sur plusieurs postes au sein du laboratoire, ou sur un serveur accessible par le WEB.
Prix éducationnel
| Licence |
Acquisition |
Mise à jour |
| mono-poste |
250.00$ (can) |
125.00$ (can) |
| laboratoire |
1000.00$ (can) |
500.00$ (can) |
La distribution comprend l'application SATO-CALIBRAGE.
- Commentaires -
© ATO
|