...
[iramuteq] / textreinert.py
1 # -*- coding: utf-8 -*-
2 # Author: Pierre Ratinaud
3 # lisence : GNU GPL
4 # copyright : 2014 (c) Pierre Ratinaud
5
6 import os
7 from time import time
8 from analysetxt import AnalyseText
9 from OptionAlceste import OptionAlc 
10 from PrintRScript import RchdTxt, AlcesteTxtProf
11 from layout import PrintRapport
12 from chemins import ChdTxtPathOut
13 from functions import DoConf, print_liste
14
15
16 class Reinert(AnalyseText) :
17     def doanalyse(self) :
18         self.parametres['type'] = 'alceste'
19         self.pathout.basefiles(ChdTxtPathOut)
20         self.actives, lim = self.corpus.make_actives_nb(self.parametres['max_actives'], 1)
21         self.parametres['eff_min_forme'] = lim
22         self.parametres['nbactives'] = len(self.actives)
23         uci = False
24         if self.parametres['classif_mode'] == 0 :
25             lenuc1, lenuc2 = self.corpus.make_and_write_sparse_matrix_from_uc(self.actives, self.parametres['tailleuc1'], self.parametres['tailleuc2'], self.pathout['TableUc1'], self.pathout['TableUc2'], self.pathout['listeuce1'], self.pathout['listeuce2'])
26             self.parametres['lenuc1'] = lenuc1
27             self.parametres['lenuc2'] = lenuc2
28         elif self.parametres['classif_mode'] == 1 :
29             self.corpus.make_and_write_sparse_matrix_from_uces(self.actives, self.pathout['TableUc1'], self.pathout['listeuce1'])
30         elif self.parametres['classif_mode'] == 2 :
31             self.corpus.make_and_write_sparse_matrix_from_uci(self.actives, self.pathout['TableUc1'], self.pathout['listeuce1'])
32             uci = True
33         Rscript = self.printRscript()
34         self.doR(Rscript, dlg=self.dlg, message='CHD...')
35
36         self.corpus.make_ucecl_from_R(self.pathout['uce'])
37         self.corpus.make_and_write_profile(self.actives, self.corpus.lc, self.pathout['Contout'], uci = uci)
38         self.sup, lim = self.corpus.make_actives_nb(self.parametres['max_actives'], 2)
39         self.corpus.make_and_write_profile(self.sup, self.corpus.lc, self.pathout['ContSupOut'], uci = uci)
40         self.corpus.make_and_write_profile_et(self.corpus.lc, self.pathout['ContEtOut'], uci = uci)
41         self.clnb = len(self.corpus.lc)
42         self.parametres['clnb'] = self.clnb
43         Rscript = self.printRscript2()
44         self.doR(Rscript, dlg=self.dlg, message='profils et A.F.C. ...')
45         self.time = time() - self.t1
46         minutes, seconds = divmod(self.time, 60)
47         hours, minutes = divmod(minutes, 60)            
48         self.parametres['time'] = '%.0fh %.0fm %.0fs' % (hours, minutes, seconds)
49         self.print_graph_files()
50
51     def preferences(self) :
52         parametres = DoConf(self.parent.ConfigPath['reinert']).getoptions('ALCESTE')
53         parametres['corpus'] = self.corpus
54         parametres['pathout'] = self.pathout
55         self.dial = OptionAlc(self.parent, parametres)
56         self.dial.CenterOnParent()
57         self.dialok = self.dial.ShowModal()
58         if self.dialok == 5100 :
59             parametres['classif_mode'] = self.dial.radio_box_2.GetSelection()
60             parametres['tailleuc1'] = self.dial.spin_ctrl_1.GetValue()
61             parametres['tailleuc2'] = self.dial.spin_ctrl_2.GetValue()
62             parametres['mincl'] = self.dial.spin_ctrl_4.GetValue()
63             parametres['minforme'] = self.dial.spin_ctrl_5.GetValue()
64             parametres['nbcl_p1'] = self.dial.spin_nbcl.GetValue()
65             parametres['max_actives'] = self.dial.spin_max_actives.GetValue()
66             parametres['corpus'] = ''
67             parametres['svdmethod'] = self.dial.svdmethod[self.dial.choicesvd.GetSelection()]
68             parametres['pathout'] = self.pathout.dirout
69             parametres['mode.patate'] = self.dial.check_patate.GetValue()
70             DoConf(self.parent.ConfigPath['reinert']).makeoptions(['ALCESTE'], [parametres])
71             self.dial.Destroy()
72             print parametres
73             return parametres
74         else :
75             self.dial.Destroy()
76             return None
77
78     def printRscript(self) :
79         RchdTxt(self.pathout, self.parent.RscriptsPath, self.parametres['mincl'], self.parametres['classif_mode'], nbt=self.parametres['nbcl_p1'] - 1, svdmethod=self.parametres['svdmethod'], libsvdc=self.parent.pref.getboolean('iramuteq', 'libsvdc'), libsvdc_path=self.parent.pref.get('iramuteq', 'libsvdc_path'), R_max_mem=False, mode_patate=self.parametres['mode.patate'])
80         return self.pathout['Rchdtxt']
81
82     def printRscript2(self) :
83         AlcesteTxtProf(self.pathout, self.parent.RscriptsPath, self.clnb, 0.9)
84         return self.pathout['RTxtProfGraph']
85
86     def print_graph_files(self) :
87         mess_afc = u"La position des points n'est peut être pas exacte"
88         afc_graph_list = [[os.path.basename(self.pathout['AFC2DL_OUT']), u'Variables actives - coordonnées - 30 points par classes - facteurs 1 / 2 - %s' % mess_afc],
89                       [os.path.basename(self.pathout['AFC2DSL_OUT']), u'variables supplémentaires - coordonnées - 30 points par classes - facteurs 1 / 2 - %s' % mess_afc],
90                       [os.path.basename(self.pathout['AFC2DEL_OUT']), u'Variables illustratives - Coordonnées - 30 points par classes - facteur 1 / 2 - %s' % mess_afc],
91                       [os.path.basename(self.pathout['AFC2DCL_OUT']), u'Classes - Coordonnées - facteur 1 / 2']]
92         chd_graph_list = [[os.path.basename(self.pathout['dendro1']), u'dendrogramme à partir de chd1']]
93         if self.parametres['classif_mode'] == 0 :
94             chd_graph_list.append([os.path.basename(self.pathout['dendro2']), u'dendrogramme à partir de chd2'])
95         chd_graph_list.append([os.path.basename(self.pathout['arbre1']), u'chd1'])
96         if self.parametres['classif_mode'] == 0 :
97             chd_graph_list.append([os.path.basename(self.pathout['arbre2']), u'chd2'])       
98         print_liste(self.pathout['liste_graph_afc'], afc_graph_list)
99         print_liste(self.pathout['liste_graph_chd'], chd_graph_list)
100         PrintRapport(self, self.corpus, self.parametres)