| |||||
Page précédente![]() |
Page d'accueil |
Page suivante |
|||
| Solution retenue et développée | |||||
|
Auteures: Cynthia Delisle, Marie Hélène Vézina
Mots-clés: automatisation, balisage SGML, indexation, NOMINO, OmniMark, SATO, textes juridiques. URL: http://www.ling.uqam.ca/ato/activites/icatel/schema.htm Date de création: 22 août 1997 Dernière version: 4 décembre 1997 Date de la prochaine révision: non prévue pour le moment | |||||
| I. Présentation de la solution retenue | |||||
| |||||
|
II. Justification de la solution retenue Dans la mesure où notre mandat consistait moins en la mise au point d'une solution théoriquement optimale qu'en la conception d'un outil ponctuellement adapté aux besoins du demandeur, nous avons opté pour la solution alambiquée schématisée à la Figure 1, espérant ainsi atteindre de bons résultats à la fois en termes d'automatisation et de qualité d'indexation et de balisage SGML. Au niveau des opérations d'indexation, la question des outils de travail à employer ne s'est pas réellement posée (outre le fait que nous devions utiliser prioritairement les logiciels développés au Service ATO, NOMINO et SATO s'avéraient dans notre cas parfaitement complémentaires: NOMINO pour l'extraction des lexies contenues dans le corpus afin de constituer les dictionnaires et SATO afin d'exploiter ces dictionnaires et le balisage SGML effectué par OmniMark pour extraire des candidats-descripteurs). En ce qui concerne le processus de "SGMLisation", le choix du logiciel OmniMark fut motivé principalement par les considérations suivantes:
Mentionnons enfin que les étapes de correction du corpus et de ré-extraction subséquente des lexies par NOMINO ne devraient pas, en principe, figurer dans le modèle théorique développé. Elles se sont cependant avérées nécessaires ponctuellement à cause de la nature de notre corpus de travail. | |||||