Corpus de recherche

Définition

  • On utilise généralement le terme de corpus pour désigner un ensemble raisonné de textes.

  • Dans le contexte d'une analyse de texte assistée par ordinateur, le corpus correspond aux données qu'on sélectionne et qu'on organise pour répondre aux fins particulières de la recherche.

 

Discussion

    = sélection de documents représentatifs d'un état du discours dont on veut saisir le fonctionnement (artefacts)

    = sorte d'échantillon stratifié à partir de critères (variables) ayant trait au...

  • Conditions de production du texte : de qui émane le texte, lieu, date, à qui est-il destiné, sa diffusion : aspect documentaire traduit par un ensemble de métadonnées.

  • Genre du texte : article, rapport, entrevue, communiqué, débat, genre littéraire, etc. :structure communicationnelle (forme interne).

  • Structure formelle du texte - caractère composite des textes et du corpus. Ex. édition des discours de Pétain

  • Format du texte : langue, degré de normalisation linguistique, type du fichier, type de balisage inscrit, type de stylage, longueur...