changelog 0.7 alpha 1
Voici le changelog, sûrement incomplet, de la version 0.7 alpha 1. Merci à tous ceux qui participent à perfectionner ce logiciel en faisant remonter les problème qu'ils rencontrent et en proposant des améliorations, des modifications et des corrections.
Un nouveau développeur listé dans les contributeurs
David Skalinder (Mash Strategy) a déjà corrigé 2 bugs qu'il a été déniché dans les profondeurs du code R. Un grand merci à lui.
Traduction
- Traduction de l'interface en portugais par Brigido Vizeu Camargo
- La traduction anglaise est complète.
Nouveaux dictionnaires et corrections
- Un dictionnaire de galicien nous est proposé par José A. Sarmiento Campos
- Le dictionnaire portugais a été corrigé par Brigido Vizeu Camargo
- Le dictionnaire espagnol a été corrigé par Mariola Moreno
- Quelques corrections dans le dictionnaire français
- Quelques corrections dans le dictionnaire anglais
Changements sur les analyses de matrices
- les matrices sont sauvegardées dans l'historique
- les analyses sur les matrices sont sauvegardées dans l'historique
- 2 nouvelles analyses :
- fréquences multiples : donne le tableau de la fréquence des modalités sur plusieurs colonnes. Très pratique pour le traitement des associations verbales par exemple.
- Analyse prototypique :
- 3 possibilités sont proposées :
- le tableau classique
- ce même tableau avec des nuages de mots
- un mode « plan » qui projette directement les mots sur un plan avec le rang en ordonnée et la fréquence en abscisse.
- Les résultats des fréquences et des chi2 sont maintenant sauvegardés par défaut.
- Ajout de la possibilité de découper une matrice en sous-matrice à partir de la sélection d'une colonne : une matrice est créée pour chaque modalité de la colonne.
Changements sur les analyses textuelles
- Construction de corpus à partir d'un import des corpus de TXM : il faut sélectionner le répertoire contenant les textes en xml (TXM/corpora/lenomducorpus/txm/LENOMDUCORPUS/). Un corpus au format .txt compatible avec iramuteq est créé.
- Construction de corpus à partir des extractions de la base de données Europress. Il faut sauvegarder les résultats d'europress en html et sélectionner le répertoire contenant un ou plusieurs de ces fichiers. Seule la source et la date sont conservés dans les meta-données.
- Possibilité de sélectionner un dictionnaire lors de l'indexation des corpus.
- Possibilité de choisir un dictionnaire différent pour chaque analyse.
- Les concordanciers sont plus rapides, ils peuvent être obtenus par un double clique sur une forme dans la plupart des tableaux.
- Possibilité de modifier le taille des graphiques de spécificités ou de chi2 par classe et d'exporter ces graphiques en svg.
Types généralisés
- Construction des Tgen par sélection des formes dans un profil ou dans un tableau de spécificité (clique droit dans le tableau)
- Construction des Tgens à partir de la liste des formes/lemmes du corpus (clique droit sur le nom de l'analyse – uniquement pour spécificités et classification)
- Calcul des spécificités des Tgens dans les analyses de spécificités (loi hypergéométrique)
- Calcul des chi2 de liaison des Tgens aux classes dans les classifications.
- Concordancier des Tgens.
- Les tgens se présentent sous la forme d'un fichier nommé tgen.csv. Ce fichier peut être construit directement dans un tableur et déposer dans le répertoire d'une analyse pour calculer les tgens sur cette analyse.
Création de sous-corpus
- Création de sous-corpus en découpant le corpus par variable ou par thématique
- Création de sous-corpus à partir de concordanciers
- Création de sous-corpus à partir des classes (clique droit sur le nom de l'analyse)
Spécificité et AFC
- Utilisation de la librairie textometry du projet TXM. Merci à l'équipe de TXM pour rendre disponible ce package sur le cran :)
- Ajout des formes banales (scores compris entre 2 et -2 pour la loi hypergéométrique, entre 3,84 et -3,84 pour le chi2).
- Ajout de l'option « segments de texte caractéristiques » par partie (clique droit sur un tableau).
Classification
- La méthode GNEPA est rebaptisée « Méthode Reinert »
- 2 nouveaux dendrogrammes : avec la liste des mots ou avec des nuages de mots
- Possibilité de faire un nuage de mot par classe (la taille des mots est proportionnelle au chi2 de liaison à la classe par défaut).
- Possibilité d'exporter une classe pour Tropes ou Owledge (clique droit sur un profil)
- Possibilité d'exporter toutes les classes sous forme de corpus texte (clique droit sur le nom de l'analyse)
- Changement dans la présentation des onglets : c'est plus lisible.
- Possibilité de créer un fichier classes_names.txt dans le répertoire de la classification pour nommer les classes. Un nom par ligne dans l'ordre des classes. Ce nom sera utilisé dans les onglets des profils.
Nuage de mots
- Possibilité de choisir le type de formes concernées
Ergonomie
- Dans l'historique, les analyses sont représentées par des icônes.
- Le dernier corpus ou la dernière matrice indexé apparaît en haut de la liste.
- Possibilité de renommer les analyses, les corpus et les matrices.
+ corrections de nombreux bugs
Actions sur le document