![]() |
Service d'analyse des cooccurrences (cooc)PrésentationCooc est un service Web qui repère les cooccurrents significatifs autour d'un objet-pôle dans un ensemble de contextes ou occurrent des objets. En analyse de texte, ces objets peuvent correspondre à la forme graphique des mots, à une propriété du mot ou à à tout phénomène dépisté en contexte. Les contextes sont des empans de texte. Pour la cooccurrence, il s'agit généralement de contextes courts, par exemple des phrases. Le fichier qui contient la description des objets et des contextes aura été préalablement construit par un programme selon un format XML-TEI. Cliquer sur le lien suivant pour voir un exemple commenté de ce format : exemple-dcc_phrase_41-50.xml Deux modèles probalistes sont proposés selon l'objet statistique considéré.
Deux lois statistiques peuvent être invoquées comme distribution théorique : la loi binomiale (pige avec remise) et la loi hypergéométrique (pige sans remise). Dans les deux cas, seront considérés comme significatifs les cooccurrences qui dépassent un certain seuil donné en paramètre. Le seuil de signification est la probabilité de se tromper si on affirme qu'un item cooccurre de façon significative avec l'item pôle. |
Formulaire |