Aller au contenu. | Aller à la navigation

Outils personnels

Navigation

Vous êtes ici : Accueil / Documentation / html / 2.5.3.1 Paramétrages de l'analyse Classification Méthode Reinert

2.5.3.1 Paramétrages de l'analyse Classification Méthode Reinert

 

Après le menu des préférences (voir chapitre 2.4), un menu de « Options » s'affiche

Choix des options pour classification GNEPA

  • Classification : Permet de choisir le mode de classification (voir chapitre 2.5.3)

  • Taille rst1 et rst2 : pour la classification double sur RST permet de faire varier la taille des regroupements de segments de texte sur les deux passages, ces unités représentent le nombre de formes actives regroupées par ligne.

  • Nombre de classes terminales de la phase 1 : Détermine le nombre de classes de la première partie de la classification, par défaut elle est réglée sur 10, mais doit être ajustée à la taille et à l’hétérogénéité du corpus.

  • Nombre minimum de segments de texte par classe : détermine un seuil minimal de ST en dessous duquel les classes ne seront pas sélectionnées. Par défaut ce nombre est égal au nombre de segments de texte divisé par le nombre de classe terminale pour la classification simple, et au nombre de segments de texte divisés par 2 fois le nombre de classes terminales pour la classification double RST.

  • Fréquence minimum d'une forme analysée : cette option n'est pas disponible.

  • Nombre maximum de forme analysées : Par défaut, les 3000 formes actives les plus fréquentes et les 3000 formes supplémentaires les plus fréquentes seront retenues. Une forme doit avoir au minimum une fréquence de 3 pour être retenue. Si le corpus à moins de 3000 formes, toutes les formes avec une fréquence supérieure ou égale à 3 seront retenues.

 

methode Ce paramètre a une forte incidence sur la taille des tableaux analysés et donc sur la quantité de mémoire de l'ordinateur mobilisée. Si votre ordinateur n'a pas assez de mémoire pour analyser un corpus, essayez de baisser ce paramètre. Si votre ordinateur possède « suffisamment » de mémoire pour le corpus et que le corpus possède plus de 3000 formes de fréquence ≥ 3, n'hésitez pas à l'augmenter.

  • Méthode pour SVD :  Cette option permet de choisir l’algorithme utilisé dans les décompositions en valeur singulières.

  • Mode Patate : cette option supprime la deuxième phase de chaque partition (voir annexe). Elle permet une analyse un peu plus rapide mais un peu moins précise.

 

 

Actions sur le document

Navigation
Liens

Le projet R

Laboratoire LERASS

Groupe REPERE

TXM

Image de la semaine

Les graphes produits avec iramuteq peuvent être exporter pour Gephi (http://gephi.org)

graphe exporté dans gephi (http://gephi.org)