changelog 0.6 alpha 1
Interface
- ajout d'un historique sur la gauche de l'interface : la plupart des options et des analyses complémentaires sont accessibles avec un clique droit sur un corpus ou sur une analyse dans cet historique ; il permet de rouvrir très simplement une analyse ou un corpus
- l'affichage de toutes les listes va beaucoup plus vite et consomme moins de mémoire
- l'ouverture des analyses est beaucoup plus rapide
- Toutes les analyses textuelles sont maintenant enregistrées par défaut dans le répertoire du corpus
- un clique droit sur une analyse ou un corpus permet d'afficher les options utilisées pour le traitement
- ajout d'outil pour découper les corpus (par variable ou par modalité)
- ajout d'outil pour importer des corpus factiva : l'importation est maintenant possible à partir des mails envoyé par factiva et à partir de copier/coller directement sur le site de factiva. Les textes proposés doivent être encodés en UTF8.
Analyse sur corpus texte
- l'indexation n'a lieu qu'une seule fois (avant elle était reconduite à chaque analyse)
- de nombreuses options sont disponibles pour cette indexation (option de nettoyage, conservation de la ponctuation, nom du répertoire en sortie, passage en minuscule, traitement des apostrophes et des tirets...).
- le format en interne des corpus a été complètement revu : la consommation de mémoire est bien moins importante et iramuteq peut maintenant traiter des corpus beaucoup plus importants.
- changement de vocabulaire pour la méthode « Reinert » ; pour des raisons de propriétés intellectuelles, tout le vocabulaire lié à la méthode Reinert a été remplacé. Voici un petit dictionnaire du nouveau vocabulaire :
Méthode ALCESTE → Méthode G.N.E.P.A. (pour Gnepa N'Est Pas Alceste)
UCI → texte UCE → segment de texte
UC → regroupement de segment de texte (rst)
- amélioration de la méthode GNEPA : l'analyse va beaucoup plus vite et peut être menée sur des corpus très grand
- ajout du mode patate dans la méthode GNEPA : le mode patate supprime la deuxième phase de tous les tours d'analyse (reclassement de toutes les lignes de la matrice) ; on perd en précision, mais ça va beaucoup plus vite.
- ajout d'options sur les nuages de mot, notamment la possibilité de sélectionner les formes.
- possibilité de sélectionner les formes directement dans le dialogue pour les analyses de similitude
- possibilité d'exporter le dictionnaire d'un corpus à partir d'une analyse statistique
- possibilité d'exporter le dictionnaire des lemmes à partir d'une analyse statistique
Analyse de similitude
- ajout du calcul des communautés : cette nouveauté est apportée par la nouvelle version de la librairie igraph. J'ai mis un exemple du rendu sur le site d'iramuteq.
- possibilité d'exporter les graphes pour gephi ; les graphes sont exportés au format graphml avec les coordonnées des points, la taille des sommets et leur couleur. Ce fichier peut ensuite être ouvert dans gephi (http://gephi.org)
- Sur les graphiques :
- format svg disponible pour les AFC et pour les graphes de similitude
- un mode sans recouvrement pour les AFC (avec bien sûr une grosse perte de précision) ; dans ce mode, certains points ne peuvent pas être représentés. La liste de ces points est écrite dans le répertoire de l'analyse.
Nouvelles langues
- ajout d'un dictionnaire pour l'italien : merci à Emanuele Fino (Université de Rome) pour le travail réalisé sur ce dictionnaire
- ajout d'un dictionnaire minimaliste pour le suédois
- ajout d'un dictionnaire minimaliste pour le grec ; Merci à Nikos Smyrnaios (Université de Toulouse) pour le travail.
- Ces deux dictionnaire sont de bons exemples de dictionnaires minimum, il ne contiennent que des formes supplémentaires.
- ajout d'un dictionnaire pour le portugais ; le travail va pouvoir commencer pour cette langue.
- les dictionnaires sont maintenant disponibles dans l'espace utilisateur dans un répertoire « dictionnaires » dans le répertoire « .iramuteq », ce qui facilite leur manipulation.
- ajout d'une option « autre langue » pour pouvoir traiter n'importe quelle langue.
Traduction de l'interface
- le travail de traduction de l'interface en anglais a commencé. Une option dans les préférences permet de choisir entre l'anglais et le français. Il faut redémarrer iramuteq pour que le changement s’opère.
Actions sur le document