SATO / Guide d'installation et de gestion de SATO-HTML v4.3

Auteur : François Daoust (Dernière mise à jour : 2011/12/12)



Ce petit guide indique comment procéder à l'installation de SATO-HTML en mode local ou en mode réseau. Il indique aussi comment en faire la gestion.

Table des matières



Principes de fonctionnement de SATO-HTML

SATO en mode HTML fonctionne en utilisant les principes et les protocoles standard de la diffusion WEB sur Internet. Les programmes exécutables précompilés sont conçus pour Windows avec processeurs de type Intel ou AMD. L'installation de SATO-HTML requiert la présence d'un serveur de requêtes WEB de même qu'un interpréteur Perl associé au type de fichier «.pl». Dans les sections qui suivent, on indique comment installer les fichiers de SATO, le serveur Web et Perl. Par la suite, on présente les divers fichiers de configuration de SATO.

[Index]
Installation de SATO

La procédure d'installation de SATO-HTML est, pour le moment, assez primitive. L'ensemble des fichiers est compressé dans un fichier satoxxx.zipxxx correspond à la date de production du fichier. On installe SATO en décompressant le fichier zip de telle sorte que s'installe un répertoire sato généralement en position c:\sato. Il s'agit de l'installation standard.

Comme SATO ne requiert aucune librairie dynamique (dll) et ne modifie pas le régistre de Windows, la désinstallation de SATO s'effectue simplement par la suppression du répertoire sato. SATO-HTML requiert requiert l'installation du programme satox.exe dans un répertoire associé au standard CGI-BIN du serveur WEB. satox.exe est une passerelle générale qui permet de contrôler une session avec SATO ou tout autre programme qui se conforme au même protocole. Le programme fonctionne avec le fichier de configuration satox.ini qui doit être installé dans le même répertoire que satox.exe.

L'interface à SATO-HTML utilise un certain nombre de fichiers HTML qui devraient normalement être installés dans un sous-répertoire sato sous la racine des fichiers documents du serveur WEB (souvent appelé htdocs).

Tout le reste de SATO devrait normalement être installé dans un répertoire sato qui ne devrait pas être accessible sur le WEB autrement qu'à travers la passerelle satox.exe. Il ne faut donc pas confondre le sous-répertoire sato de htdocs, qui contient les fichiers publics de SATO, avec le répertoire principal sato qui contient les programmes et les comptes des usagers.

Dans le répertoire principal de SATO, on trouve un fichier sato.ini qui contient la dédicace et les limites d'utilisation du logiciel. Le fichier fourni dans l'installation standard pourra être écrasée par un fichier spécifique fourni par le Centre ATO pour chaque installation.



[Index]
Installation d'un serveur Web

SATO peut fonctionner avec tout serveur de pages Web supportant le protocole CGI standard (Common Gateway Interface). SATO utilise aussi des témoins (cookie) pour empêcher qu'une session active puisse être dérobée par un autre internaute. Pour une utilisation locale sur ordinateur personnel, on peut inhiber ce dispositif. Voir Fichier de configuration de la passerelle.

Le gestionnaire du serveur Web, ou l'usager individuel qui désire effectuer une installation locale sur son poste de travail, pourra choisir le serveur de son choix. Mais, pour faciliter la chose pour l'utilisateur novice, nous donnerons ici des indications sur l'installation et la configuration du serveur Apache qui est gratuit, robuste et largement distribué. (http://httpd.apache.org/).

En juin 2011, l'adresse de éléchargement d'Apache était : httpd.apache.org/download.cgi. On peut utiliser la version courante sans support de la communication cryptée. En juin 2011, la dernière version stable était notée 2.2.19, décrite de la façon suivante : Win32 Binary without crypto (no mod_ssl) (MSI Installer): httpd-2.2.19-win32-x86-no_ssl.msi. Une version 64 bits était aussi disponible.

L'installation exigera des privilèges d'administrateur du PC. Selon le système d'exploitation, on devra confirmer l'installation à divers moments et répondre à certaines questions de base. Nous choisissons ici d'installer SATO en version locale sur PC avec les choix suivants.

Après l'installation, on peut vérifier que le serveur est en fonction en tapant l'adresse suivante dans son navigateur Web : http://localhost.

On devrait obtenir la phrase suivante:
It works!

Pour donner accès à SATO au moyen du serveur Web, il y a deux possibilités. On peut déplacer certains répertoires et fichiers contenus dans le répertoire principal de SATO vers les répertoires appropriés d'Apache ou de tout autre serveur Web. Ou bien, on modifie le fichier de configuration du serveur Web pour qu'il pointe vers les répertoires appropriés de SATO. Nous présentons les deux méthodes en commençant par le déplacement des fichiers de SATO.

Les fichiers HTML de SATO se trouvent normalement sous c:\sato\htdocs\sato. Il s'agit donc de déplacer ou de copier ce répertoire sous le répertoire associé à la racine htdocs du serveur WEB, par exemple C:\Program Files\Apache Software Foundation\Apache2.2\htdocs. De même, le contenu du répertoire c:\sato\htdocs\cgi-bin devra être déplacé vers le répertoire du serveur répondant aux requêtes cgi-bin, par exemple C:\Program Files\Apache Software Foundation\Apache2.2\cgi-bin.

L'autre option consiste à modifier le fichier de configuration d'Apache pour qu'il pointe sur les sous-répertoires htdocs et cgi-bin de SATO. On pourra aussi en profiter pour en restreindre l'accès du serveur aux utilisateurs locaux de l'ordinateur dans le cas d'une installation personnelle de SATO. Il faut être administrateur de l'ordinateur pour modifier le fichier de configuration d'Apache.

Dans l'installation standard de cette version d'Apache, le fichier de configuration est le suivant : C:\Program Files\Apache Software Foundation\Apache2.2\conf\httpd.conf

On pourra ouvrir le fichier avec un éditeur de texte comme le Bloc-notes de Windows afin d'y apporter les modifications suivantes.

Nous remplaçons la ligne
DocumentRoot "C:/Program Files/Apache Software Foundation/Apache2.2/htdocs"
par
# DocumentRoot "C:/Program Files/Apache Software Foundation/Apache2.2/htdocs"
DocumentRoot "C:/sato/htdocs"

La ligne originale a été mise en commentaire par l'ajout de # suivi d'un espace. La deuxième ligne a été ajoutée pour faire pointer la racine des documents HTML sur le sous-répertoire htdocs de sato.

Plus bas dans le fichier de configuration, on modifiera la ligne
<Directory "C:/Program Files/Apache Software Foundation/Apache2.2/htdocs">
par
# <Directory "C:/Program Files/Apache Software Foundation/Apache2.2/htdocs">
<Directory "C:/sato/htdocs">

Il est à noter que dans cette section
<Directory "C:/sato/htdocs">
on retrouve la ligne
Allow from all.
Pour une installation sur ordinateur personnel non protégé par un coupe-feu, on pourra interdire l'accès à tout usager externe en remplaçant cette ligne par
Allow from localhost 127.0.0.1

Plus bas encore, on modifiera la ligne
ScriptAlias /cgi-bin/ "C:/Program Files/Apache Software Foundation/Apache2.2/cgi-bin/"
par
# ScriptAlias /cgi-bin/ "C:/Program Files/Apache Software Foundation/Apache2.2/cgi-bin/"
ScriptAlias /cgi-bin/ "C:/sato/htdocs/cgi-bin/"

De même la ligne
<Directory "C:/Program Files/Apache Software Foundation/Apache2.2/cgi-bin">
sera remplacée par
# <Directory "C:/Program Files/Apache Software Foundation/Apache2.2/cgi-bin">
<Directory "C:/sato/cgi-bin">

Il est à noter que dans cette section
<Directory "C:/sato/cgi-bin">
on retrouve la ligne
Allow from all.
Pour une installation sur ordinateur personnel non protégé par un coupe-feu, on pourra interdire l'accès à tout usager externe en remplaçant cette ligne par
Allow from localhost 127.0.0.1

Il suffit maintenant de sauvegarder le fichier de configuration ainsi modifié et de repartir le serveur Apache. Pour ce faire, on peut cliquer sur l'icône Apache normalement située dans la partie droite de la barre de tâche de Windows.

Quelque soit le mode d'installation choisi, pour appeler SATO, il s'agira finalement d'entrer l'adresse suivante dans son navigateur Web:
http://localhost/sato Voir Démarrage de SATO-HTML. Pour une installation sur un serveur public, localhost sera remplacée par l'adresse Web du serveur.



[Index]
Installation de Perl

Le langage Perl est développé par Larry Wall. Il est très largement utilisé dans le contexte des applications WEB. Aussi, plusieurs utilitaires utilisés par l'interface SATO-HTML sont écrits en Perl.

L'interpréteur de programmes Perl est disponible gratuitement sur une variété de plateformes informatiques. Le site Web http://www.perl.org/get.html en dresse l'inventaire. Pour SATO, nous avons testé avec succès la distribution http://padre-perl-ide.googlecode.com/files/padre-on-strawberry-5.12.3.0-v5.exe. Après avoir téléchargé cet installateur, un double-clic sur le nom du fichier téléchargé amorce l'installation. Il est prudent de redémarrer l'ordinateur après cette installation.

Certains modules Perl utilisés par SATO ne sont pas fournis avec cette distribution. On peut ajouter ces modules facilement. Sous l'onglet Démarrer de Windows, on choisit l'onglet Perl (command line) sans le dossier Strawberry Perl. On verra apparaitre une fenêtre de commande dans laquelle il suffira d'entrer à tour de rôle les trois commandes suivantes :

Comme une mauvaise installation de Perl risque d'empêcher le bon fonctionnement de SATO, on a ajouté un appel à Perl qui vérifie l'installation des modules à chaque ouverture de session. Donc, si, après l'ouverture d'une session SATO en mode intégral, on voit apparaître des diagnostics d'erreurs dans la fenêtre inférieure de l'écran, c'est qu'il y a un problème d'installation.

[Index]
Installation facultative de TreeTagger et Flem

L'interface HTML de SATO permet d'appeler des analyseurs linguistiques externes. On trouve ces appels dans la partie Tâches/Catégorisation grammaticale de l'interface. Il s'agit de l'étiqueteur de catégories grammaticales TreeTagger, développé par Achim Stein à l'Institut de linguistique computationnelle de l'Université de Stuttgart. C'est aussi le cas de Flemm, un analyseur morphologique développé à l'Université de Nancy par Fiammetta Namer. Ces logiciels ne font pas partie de la distribution de SATO. Ils peuvent être obtenus gratuitement sur Internet, mais on doit les installer soi-même si on désire les utiliser. SATO appelle ces modules en utilisant des fichiers .bat que l'on trouve dans le sous-répertoire bin. Les procédures assument que ces logiciels sont installés dans les répertoires C:\TreeTagger et C:\Flemm respectivement.

[Index]
Démarrage de SATO-HTML

Une fois que le serveur WEB est démarré, on accède à SATO à travers son fureteur Internet. Si SATO est installé localement, on accède au serveur web local via l'adresse IP 127.0.0.1 et on ouvre une session SATO par l'URL http://127.0.0.1/sato. Le nom symbolique «localhost» est généralement reconnu comme un équivalent à l'adresse numérique «127.0.0.1».

Même en mode local, SATO-HTML est une application multi-usagers. On peut définir autant d'usagers que l'on veut. La license d'utilisation individuelle limite cependant les capacités à deux sessions parallèles. En fait, chaque usager peut correspondre à un projet, ce qui permet de répartir les données sur plusieurs répertoires. L'index de démarrage implicite est le fichier index.html situé normalement dans c:\sato\htdocs\sato. Une copie du fichier se trouve sous «c:\sato\htdocs\». Ce fichier permet d'ouvrir une session dans un compte existant et de créer de nouveaux comptes. Dans une installation réseau, on pourra, si on désire, limiter la création des comptes en modifiant index.html pour y enlever les champs de création de nouveaux comptes. Comme index.html permettra seulement l'accès à un compte existant, il appartiendra au gestionnaire de SATO de créer les nouveaux comptes, comme expliqué à la section suivante.

SATO fournit au départ un certain nombre de comptes anonymes notés 1, 2, 3... Il y a aussi un compte sato réservé à la gestion. Les comptes des usagers se trouvent sous le répertoire c:\sato\usagers.

[Index]


Structure des répertoires de SATO

Dans une installation standard de SATO, tous les fichiers sont localisés dans c:\sato.

Voici un bref descriptif de la structure du répertoire c:\sato.



[Index]
Le compte de gestion de SATO

Dans le répertoire usagers, on trouve un compte prédéfini appelé sato. C'est dans le répertoire sato correspondant à ce compte que l'on retrouve les fichiers d'inscription des usagers, ainsi que les fichiers .ses qui indiquent les sessions actives. C'est aussi là que se trouvent les journaux enregistrant les statistiques d'accès à SATO. La gestion du serveur SATO se fait à partir de l'hyperlien Administration/Gestion disponible depuis l'index principal de SATO : http://nom-de-domaine/sato.

Voici une description des fichiers manipulés par cet interface.

Les fichiers d'inscription des usagers sont des fichiers .txt dont le nom correspond au répertoire de l'usager. Par exemple sato.txt correspond au compte du gestionnaire de SATO. Le mot de passe prédéfini du compte de gestion sato est «sato». Pour l'installation sur un serveur public, il faut impérativement modifier ce mot de passe pour éviter des accès non-autorisés. Voici une transcription du fichier sato.txt

sato
Administrateur SATO
administrateur.sato@monadresse.ca

On trouve d'abord le mot de passe. On trouve ensuite le nom complet du propriétaire du compte et son adresse électronique sur la troisième ligne.

Le fichier satox.log contient les statistiques courantes d'accès à SATO. Les autres fichiers .log contiennent les accès archivés.

[Index]


Fichier de configuration de la passerelle

La passerelle satox.exe utilise un fichier le configuration satox.ini situé dans le sous-répertoire où est installée la passerelle, par exemple cgi-bin. . En voici un exemple
[Adm]
admin=
sessionnmax=
tracer=non
cookie=oui
serveurnom=Bienvenue sur le serveur SATO local
[Env]
usagerrep=c:\sato\usagers\
satorep=c:\sato\
sessionrep=c:\sato\sessions\
[Exe]
sato=c:\sato\sato.exe
bino=c:\perl\bin\perl c:\sato\bin\bino.pl
gestion=c:\perl\bin\perl c:\sato\bin\gestion.pl
calibrer=c:\perl\bin\perl c:\sato\bin\calibrer.pl
locbloc=c:\perl\bin\perl c:\sato\bin\locbloc.pl
source-html=c:\perl\bin\perl.exe c:\sato\bin\source-html.pl
TeiToProp=c:\perl\bin\perl.exe c:\sato\bin\TeiToProp.pl
PropToTei=c:\perl\bin\perl.exe c:\sato\bin\PropToTei.pl
[Var]
v0=
v1=
v2=
v3=
v4=
v5=
v6=
v7=
v8=
v9=
satoman=http://localhost

Le fichier satox.ini est construit d'après les modèles des fichiers «.ini» de Windows. Les noms de sections sont entre parenthèses carrées. Les variables sont définies à raison d'une par ligne sous la forme «variable=valeur».

Dans la section [Adm] on trouve la variable admin qui contrôle la création de comptes d'usager. Si le contenu de la variable est vide, la création de compte est libre. Si la variable a une valeur, la chaîne inscrite dans le fichier de configuration sera confrontée au champ admin du formulaire de création des nouveaux comptes. Ce mécanisme permet de restreindre la création de nouveaux comptes aux gestionnaires de SATO qui connaissent le mot de passe défini dans le fichier de configuration. La variable sessionnmax ne doit pas être modifiée. Elle contient un code fourni avec la livraison de votre copie de SATO.

La section [Env] contient les variables de localisation des fichiers SATO. usagerrep indique le chemin vers la racine à partir de laquelle seront créés les espaces de travail des usagers. La variable satorep indique où est installé SATO et la variable sessionrep où seront créées les répertoires de travail pour les sessions SATO. La variable tracer est utilisé pour activer le mode de validation. La variable cookie est utilisée pour activer l'utilisation des témoins à des fins de sécurité. La variable devrait être à oui pour l'utilisation de SATO en mode Internet.

La section [Exe] contient la liste des noms de programmes qui peuvent être démarrés par la passerelle. En effet, pour des raisons de sécurité, le nom des programmes à démarrer correspondent à des variables inscrites dans la section Env, et dont la valeur doit correspondre à la localisation complète du fichier à exécuter.

Enfin, la section [Var] contient la liste de variables que l'on utilise dans les fichiers HTML de l'interface SATO. La valeur définie pour une variable sera utilisée seulement dans le cas où le formulaire d'appel de la passerelle ne contiendrait pas de valeur pour le paramètre du même nom. À moins d'avoir à modifier l'interface de SATO, on ne devrait pas modifier cette section du fichier de configuration.

[Index]