18b387988d9b0eae3840de0a21d4cb2b130e5d55
[iramuteq] / PrintRScript.py
1 # -*- coding: utf-8 -*-
2 #Author: Pierre Ratinaud
3 #Copyright (c) 2008-2011 Pierre Ratinaud
4 #Lisense: GNU/GPL
5
6 import tempfile
7 from chemins import ffr
8 import os
9 import locale
10 from datetime import datetime
11 import logging
12
13 log = logging.getLogger('iramuteq.printRscript')
14
15 class PrintRScript :
16     def __init__ (self, analyse):
17         log.info('Rscript')
18         self.pathout = analyse.pathout
19         self.analyse = analyse
20         self.parametres = analyse.parametres
21         self.scriptout = self.pathout['temp']
22         self.script =  u"#Script genere par IRaMuTeQ - %s" % datetime.now().ctime()
23     
24     def add(self, txt) :
25         self.script = '\n'.join([self.script, txt])
26     
27     def defvar(self, name, value) :
28         self.add(' <- '.join([name, value]))
29
30     def defvars(self, lvars) :
31         for val in lvars :
32             self.defvar(val[0],val[1])
33
34     def sources(self, lsources) :
35         for source in lsources :
36             self.add('source("%s")' % source)
37
38     def packages(self, lpks) :
39         for pk in lpks :
40             self.add('library(%s)' % pk)
41
42     def load(self, l) :
43         for val in l :
44             self.add('load("%s")' % val)
45
46     def write(self) :
47         with open(self.scriptout, 'w') as f :
48             f.write(self.script)
49
50
51 class chdtxt(PrintRScript) :
52     pass
53
54 def Rcolor(color) :
55     return str(color).replace(')', ', max=255)')
56
57 class Alceste2(PrintRScript) :
58     def doscript(self) :
59         self.sources(['chdfunct'])
60         self.load(['Rdata'])
61         lvars = [['clnb', `self.analyse.clnb`], 
62                 ['Contout', '"%s"' % self.pathout['Contout']],
63                 ['ContSupOut', '"%s"' % self.pathout['ContSupOut']],
64                 ['ContEtOut', '"%s"' % self.pathout['ContEtOut']],
65                 ['profileout', '"%s"' % self.pathout['profils.csv']],
66                 ['antiout', '"%s"' % self.pathout['antiprofils.csv']],
67                 ['chisqtable', '"%s"' % self.pathout['chisqtable.csv']],
68                 ['ptable', '"%s"' % self.pathout['ptable.csv']]]
69        
70         self.defvars(lvars) 
71
72
73
74 #    txt = "clnb<-%i\n" % clnb
75 #    txt += """
76 #source("%s")
77 #load("%s")
78 #""" % (RscriptsPath['chdfunct'], DictChdTxtOut['RData'])
79 #    txt += """
80 #dataact<-read.csv2("%s", header = FALSE, sep = ';',quote = '\"', row.names = 1, na.strings = 'NA')
81 #datasup<-read.csv2("%s", header = FALSE, sep = ';',quote = '\"', row.names = 1, na.strings = 'NA')
82 #dataet<-read.csv2("%s", header = FALSE, sep = ';',quote = '\"', row.names = 1, na.strings = 'NA')
83 #""" % (DictChdTxtOut['Contout'], DictChdTxtOut['ContSupOut'], DictChdTxtOut['ContEtOut'])
84 #    txt += """
85 #tablesqrpact<-BuildProf(as.matrix(dataact),n1,clnb)
86 #tablesqrpsup<-BuildProf(as.matrix(datasup),n1,clnb)
87 #tablesqrpet<-BuildProf(as.matrix(dataet),n1,clnb)
88 #"""
89 #    txt += """
90 #PrintProfile(n1,tablesqrpact[4],tablesqrpet[4],tablesqrpact[5],tablesqrpet[5],clnb,"%s","%s",tablesqrpsup[4],tablesqrpsup[5])
91 #""" % (DictChdTxtOut['PROFILE_OUT'], DictChdTxtOut['ANTIPRO_OUT'])
92 #    txt += """
93 #colnames(tablesqrpact[[2]])<-paste('classe',1:clnb,sep=' ')
94 #colnames(tablesqrpact[[1]])<-paste('classe',1:clnb,sep=' ')
95 #colnames(tablesqrpsup[[2]])<-paste('classe',1:clnb,sep=' ')
96 #colnames(tablesqrpsup[[1]])<-paste('classe',1:clnb,sep=' ')
97 #colnames(tablesqrpet[[2]])<-paste('classe',1:clnb,sep=' ')
98 #colnames(tablesqrpet[[1]])<-paste('classe',1:clnb,sep=' ')
99 #chistabletot<-rbind(tablesqrpact[2][[1]],tablesqrpsup[2][[1]])
100 #chistabletot<-rbind(chistabletot,tablesqrpet[2][[1]])
101 #ptabletot<-rbind(tablesqrpact[1][[1]],tablesqrpet[1][[1]])
102 #"""
103 #    txt += """
104 #write.csv2(chistabletot,file="%s")
105 #write.csv2(ptabletot,file="%s")
106 #gbcluster<-n1
107 #write.csv2(gbcluster,file="%s")
108 #""" % (DictChdTxtOut['chisqtable'], DictChdTxtOut['ptable'], DictChdTxtOut['SbyClasseOut'])
109 #
110
111
112 def RchdTxt(DicoPath, RscriptPath, mincl, classif_mode, nbt = 9, libsvdc = False, libsvdc_path = None, R_max_mem = False):
113     txt = """
114     source("%s")
115     source("%s")
116     source("%s")
117     source("%s")
118     """ % (RscriptPath['CHD'], RscriptPath['chdtxt'], RscriptPath['anacor'], RscriptPath['Rgraph'])
119     if R_max_mem :
120         txt += """
121     memory.limit(%i)
122         """ % R_max_mem
123
124     txt += """
125     nbt <- %i
126     """ % nbt
127     if libsvdc :
128         txt += """
129         libsvdc <- TRUE
130         libsvdc.path <- "%s"
131         """ % ffr(libsvdc_path)
132     else :
133         txt += """
134         libsvdc <- FALSE
135         libsvdc.path <- NULL
136         """
137
138     txt +="""
139     library(Matrix)
140     data1 <- readMM("%s")
141     data1 <- as(data1, "dgCMatrix")
142     row.names(data1) <- 1:nrow(data1)
143     """ % DicoPath['TableUc1']
144     
145     if classif_mode == 0:
146         txt += """
147         data2 <- readMM("%s")
148         data2 <- as(data2, "dgCMatrix")
149         row.names(data2) <- 1:nrow(data2)
150         """ % DicoPath['TableUc2']
151     #log.info('ATTENTION ############# MODEPATATE ####################')
152     txt += """
153     chd1<-CHD(data1, x = nbt, mode.patate = FALSE, libsvdc = libsvdc, libsvdc.path = libsvdc.path)
154     """
155     
156     if classif_mode == 0:
157         txt += """
158     chd2<-CHD(data2, x = nbt, libsvdc = libsvdc, libsvdc.path = libsvdc.path)
159     """
160     else:
161         txt += """
162     chd2<-chd1
163     """    
164     
165     txt += """
166     #lecture des uce
167     listuce1<-read.csv2("%s")
168     """ % DicoPath['listeuce1']
169     
170     if classif_mode == 0:
171         txt += """
172         listuce2<-read.csv2("%s")
173         """ % DicoPath['listeuce2']
174         
175     txt += """
176     rm(data1)
177     """
178     
179     if classif_mode == 0:
180         txt += """
181         rm(data2)
182         """
183     txt += """
184     chd.result <- Rchdtxt("%s",mincl=%i,classif_mode=%i, nbt = nbt)
185     n1 <- chd.result$n1
186     classeuce1 <- chd.result$cuce1
187     classeuce2 <- chd.result$cuce2
188     """ % (DicoPath['uce'], mincl, classif_mode)
189     
190     txt += """
191     tree.tot1 <- make_tree_tot(chd1)
192 #    open_file_graph("%s", widt = 600, height=400)
193 #    plot(tree.tot1$tree.cl)
194 #    dev.off()
195     """%DicoPath['arbre1']
196     
197     if classif_mode == 0:
198         txt += """
199         tree.tot2 <- make_tree_tot(chd2)
200 #        open_file_graph("%s", width = 600, height=400)
201 #        plot(tree.tot2$tree.cl)
202 #        dev.off()
203         """ % DicoPath['arbre2']  
204               
205     txt += """
206     tree.cut1 <- make_dendro_cut_tuple(tree.tot1$dendro_tuple, chd.result$coord_ok, classeuce1, 1, nbt)
207     save(tree.cut1, file="%s")
208     classes<-n1[,ncol(n1)]
209     open_file_graph("%s", width = 600, height=400)
210     plot.dendropr(tree.cut1$tree.cl,classes, histo=TRUE)
211     open_file_graph("%s", width = 600, height=400)
212     plot(tree.cut1$dendro_tot_cl)
213     dev.off()
214     """ % (DicoPath['Rdendro'], DicoPath['dendro1'], DicoPath['arbre1'])
215     
216     if classif_mode == 0:
217         txt += """
218         tree.cut2 <- make_dendro_cut_tuple(tree.tot2$dendro_tuple, chd.result$coord_ok, classeuce2, 2, nbt)
219         open_file_graph("%s", width = 600, height=400)
220         plot(tree.cut2$tree.cl)
221         dev.off()
222         open_file_graph("%s", width = 600, height=400)
223         plot(tree.cut1$dendro_tot_cl)
224         dev.off()
225         """ % (DicoPath['dendro2'], DicoPath['arbre2'])
226         
227     txt += """
228     save.image(file="%s")
229     """ % DicoPath['RData']
230     fileout = open(DicoPath['Rchdtxt'], 'w')
231     fileout.write(txt)
232     fileout.close()
233
234 def RPamTxt(corpus, RscriptPath):
235     DicoPath = corpus.dictpathout
236     param = corpus.parametre
237     print param
238     txt = """
239     source("%s")
240     """ % (RscriptPath['pamtxt'])
241     txt += """
242     source("%s")
243     """ % (RscriptPath['Rgraph'])
244     txt += """
245     result <- pamtxt("%s", "%s", "%s", method = "%s", clust_type = "%s", clnb = %i)
246     n1 <- result$uce
247     """ % (DicoPath['TableUc1'], DicoPath['listeuce1'], DicoPath['uce'], param['method'], param['cluster_type'], param['nbcl'] )
248     txt += """
249     open_file_graph("%s", width=400, height=400)
250     plot(result$cl)
251     dev.off()
252     """ % (DicoPath['arbre1'])
253     txt += """
254     save.image(file="%s")
255     """ % DicoPath['RData']
256     fileout = open(DicoPath['Rchdtxt'], 'w')
257     fileout.write(txt)
258     fileout.close()
259     
260
261 def RchdQuest(DicoPath, RscriptPath, nbcl = 10, mincl = 10):
262     txt = """
263     source("%s")
264     source("%s")
265     source("%s")
266     source("%s")
267     """ % (RscriptPath['CHD'], RscriptPath['chdquest'], RscriptPath['anacor'],RscriptPath['Rgraph'])
268
269     txt += """
270     nbt <- %i - 1
271     mincl <- %i
272     """ % (nbcl, mincl)
273
274     txt += """
275     chd.result<-Rchdquest("%s","%s","%s", nbt = nbt, mincl = mincl)
276     n1 <- chd.result$n1
277     classeuce1 <- chd.result$cuce1
278     """ % (DicoPath['Act01'], DicoPath['listeuce1'], DicoPath['uce'])
279     
280     txt += """
281     tree_tot1 <- make_tree_tot(chd.result$chd)
282     open_file_graph("%s", width = 600, height=400)
283     plot(tree_tot1$tree.cl)
284     dev.off()
285     """%DicoPath['arbre1']
286     
287     txt += """
288     tree_cut1 <- make_dendro_cut_tuple(tree_tot1$dendro_tuple, chd.result$coord_ok, classeuce1, 1, nbt)
289     tree.cut1 <- tree_cut1
290     save(tree.cut1, file="%s")
291     open_file_graph("%s", width = 600, height=400)
292     classes<-n1[,ncol(n1)]
293     plot.dendropr(tree_cut1$tree.cl,classes)
294     """ % (DicoPath['Rdendro'],DicoPath['dendro1'])
295     
296     txt += """
297     save.image(file="%s")
298     """ % DicoPath['RData']
299     fileout = open(DicoPath['Rchdquest'], 'w')
300     fileout.write(txt)
301     fileout.close()
302     
303 def AlcesteTxtProf(DictChdTxtOut, RscriptsPath, clnb, taillecar):
304     txt = "clnb<-%i\n" % clnb
305     txt += """
306 source("%s")
307 load("%s")
308 """ % (RscriptsPath['chdfunct'], DictChdTxtOut['RData'])
309     txt += """
310 dataact<-read.csv2("%s", header = FALSE, sep = ';',quote = '\"', row.names = 1, na.strings = 'NA')
311 datasup<-read.csv2("%s", header = FALSE, sep = ';',quote = '\"', row.names = 1, na.strings = 'NA')
312 dataet<-read.csv2("%s", header = FALSE, sep = ';',quote = '\"', row.names = 1, na.strings = 'NA')
313 """ % (DictChdTxtOut['Contout'], DictChdTxtOut['ContSupOut'], DictChdTxtOut['ContEtOut'])
314     txt += """
315 tablesqrpact<-BuildProf(as.matrix(dataact),n1,clnb)
316 tablesqrpsup<-BuildProf(as.matrix(datasup),n1,clnb)
317 tablesqrpet<-BuildProf(as.matrix(dataet),n1,clnb)
318 """
319     txt += """
320 PrintProfile(n1,tablesqrpact[4],tablesqrpet[4],tablesqrpact[5],tablesqrpet[5],clnb,"%s","%s",tablesqrpsup[4],tablesqrpsup[5])
321 """ % (DictChdTxtOut['PROFILE_OUT'], DictChdTxtOut['ANTIPRO_OUT'])
322     txt += """
323 colnames(tablesqrpact[[2]])<-paste('classe',1:clnb,sep=' ')
324 colnames(tablesqrpact[[1]])<-paste('classe',1:clnb,sep=' ')
325 colnames(tablesqrpsup[[2]])<-paste('classe',1:clnb,sep=' ')
326 colnames(tablesqrpsup[[1]])<-paste('classe',1:clnb,sep=' ')
327 colnames(tablesqrpet[[2]])<-paste('classe',1:clnb,sep=' ')
328 colnames(tablesqrpet[[1]])<-paste('classe',1:clnb,sep=' ')
329 chistabletot<-rbind(tablesqrpact[2][[1]],tablesqrpsup[2][[1]])
330 chistabletot<-rbind(chistabletot,tablesqrpet[2][[1]])
331 ptabletot<-rbind(tablesqrpact[1][[1]],tablesqrpet[1][[1]])
332 """
333     txt += """
334 write.csv2(chistabletot,file="%s")
335 write.csv2(ptabletot,file="%s")
336 gbcluster<-n1
337 write.csv2(gbcluster,file="%s")
338 """ % (DictChdTxtOut['chisqtable'], DictChdTxtOut['ptable'], DictChdTxtOut['SbyClasseOut'])
339     if clnb > 2 :
340         txt += """
341     library(ca)
342     colnames(dataact)<-paste('classe',1:clnb,sep=' ')
343     colnames(datasup)<-paste('classe',1:clnb,sep=' ')
344     colnames(dataet)<-paste('classe',1:clnb,sep=' ')
345     rowtot<-nrow(dataact)+nrow(dataet)+nrow(datasup)
346     afctable<-rbind(as.matrix(dataact),as.matrix(datasup))
347     afctable<-rbind(afctable,as.matrix(dataet))
348     colnames(afctable)<-paste('classe',1:clnb,sep=' ')
349     afc<-ca(afctable,suprow=((nrow(dataact)+1):rowtot),nd=(ncol(afctable)-1))
350     debsup<-nrow(dataact)+1
351     debet<-nrow(dataact)+nrow(datasup)+1
352     fin<-rowtot
353     afc<-AddCorrelationOk(afc)
354     """
355     #FIXME : split this!!!
356         txt += """
357     source("%s")
358     """ % RscriptsPath['Rgraph']
359     
360         txt += """
361         afc <- summary.ca.dm(afc)
362         afc_table <- create_afc_table(afc)
363         write.csv2(afc_table$facteur, file = "%s")
364         write.csv2(afc_table$colonne, file = "%s")
365         write.csv2(afc_table$ligne, file = "%s")
366         """ % (DictChdTxtOut['afc_facteur'], DictChdTxtOut['afc_col'], DictChdTxtOut['afc_row'])
367     
368         txt += """
369         #xlab <- paste('facteur 1 - ', round(afc$facteur[1,2],2), sep = '')
370         #ylab <- paste('facteur 2 - ', round(afc$facteur[2,2],2), sep = '')
371         #xlab <- paste(xlab, ' %', sep = '')
372         #ylab <- paste(ylab, ' %', sep = '')
373         """
374     
375         txt += """
376     PARCEX<-%s
377     xmin <- min(afc$rowcoord[,1], na.rm = TRUE) + (0.1 * min(afc$rowcoord[,1], na.rm = TRUE))
378     xmax <- max(afc$rowcoord[,1], na.rm = TRUE) + (0.1 * max(afc$rowcoord[,1], na.rm = TRUE))
379     ymin <- min(afc$rowcoord[,2], na.rm = TRUE) + (0.1 * min(afc$rowcoord[,2], na.rm = TRUE))
380     ymax <- max(afc$rowcoord[,2], na.rm = TRUE) + (0.1 * max(afc$rowcoord[,2], na.rm = TRUE))
381     print(xmin)
382     print(xmax)
383     print(ymin)
384     print(ymax)
385     """ % taillecar
386         txt += """
387     PlotAfc2dCoul(afc, as.data.frame(chistabletot), "%s", what='coord', deb=1, fin=(debsup-1), xlab = xlab, ylab = ylab, xmin=xmin, xmax=xmax, ymin = ymin, ymax=ymax)
388     """ % (DictChdTxtOut['AFC2DL_OUT'])
389         txt += """
390     PlotAfc2dCoul(afc, as.data.frame(chistabletot), "%s", what='coord', deb=debsup, fin=(debet-1), xlab = xlab, ylab = ylab, xmin=xmin, xmax=xmax, ymin = ymin, ymax=ymax)
391     """ % (DictChdTxtOut['AFC2DSL_OUT'])
392         txt += """
393     PlotAfc2dCoul(afc, as.data.frame(chistabletot), "%s", what='coord', deb=debet, fin=fin, xlab = xlab, ylab = ylab, xmin=xmin, xmax=xmax, ymin = ymin, ymax=ymax)
394     """ % (DictChdTxtOut['AFC2DEL_OUT'])
395         txt += """
396     PlotAfc2dCoul(afc, as.data.frame(chistabletot), "%s", col=TRUE, what='coord', xlab = xlab, ylab = ylab, xmin=xmin, xmax=xmax, ymin = ymin, ymax=ymax)
397     """ % (DictChdTxtOut['AFC2DCL_OUT'])
398 #        txt += """
399  #   PlotAfc2dCoul(afc, as.data.frame(chistabletot), "%s", what='crl', deb=1, fin=(debsup-1), xlab = xlab, ylab = ylab)
400  #   PlotAfc2dCoul(afc, as.data.frame(chistabletot), "%s", what='crl', deb=debsup, fin=(debet-1), xlab = xlab, ylab = ylab)
401   #  PlotAfc2dCoul(afc, as.data.frame(chistabletot), "%s", what='crl', deb=debet, fin=fin, xlab = xlab, ylab = ylab)
402  #   PlotAfc2dCoul(afc, as.data.frame(chistabletot), "%s", col=TRUE, what='crl', xlab = xlab, ylab = ylab)
403  #   """ % (DictChdTxtOut['AFC2DCoul'], DictChdTxtOut['AFC2DCoulSup'], DictChdTxtOut['AFC2DCoulEt'], DictChdTxtOut['AFC2DCoulCl'])
404        
405     txt += """
406 #rm(dataact)
407 #rm(datasup)
408 #rm(dataet)
409 rm(tablesqrpact)
410 rm(tablesqrpsup)
411 rm(tablesqrpet)
412 save.image(file="%s")
413 """ % DictChdTxtOut['RData']
414     file = open(DictChdTxtOut['RTxtProfGraph'], 'w')
415     file.write(txt)
416     file.close()
417
418
419 def write_afc_graph(self):
420     if self.param['over'] : over = 'TRUE'
421     else : over = 'FALSE'
422
423     if self.param['do_select_nb'] : do_select_nb = 'TRUE'
424     else : do_select_nb = 'FALSE'
425
426     if self.param['do_select_chi'] : do_select_chi = 'TRUE'
427     else : do_select_chi = 'FALSE'
428
429     if self.param['do_select_chi_classe'] : do_select_chi_classe = 'TRUE'
430     else : do_select_chi_classe = 'FALSE'
431
432     if self.param['cex_txt'] : cex_txt = 'TRUE'
433     else : cex_txt = 'FALSE'
434
435     if self.param['tchi'] : tchi = 'TRUE'
436     else : tchi = 'FALSE'
437
438     with open(self.RscriptsPath['afc_graph'], 'r') as f:
439         txt = f.read()
440
441 #    self.DictPathOut['RData'], \
442     scripts = txt % (self.RscriptsPath['Rgraph'],\
443     self.param['typegraph'], \
444     self.param['what'], \
445     self.param['facteur'][0],\
446     self.param['facteur'][1], \
447     self.param['facteur'][2], \
448     self.param['qui'], \
449     over,  do_select_nb, \
450     self.param['select_nb'],  \
451     do_select_chi, \
452     self.param['select_chi'], \
453     do_select_chi_classe, \
454     self.param['nbchic'], \
455     cex_txt, \
456     self.param['txt_min'], \
457     self.param['txt_max'], \
458     self.fileout, \
459     self.param['width'], \
460     self.param['height'],\
461     self.param['taillecar'], \
462     self.param['alpha'], \
463     self.param['film'], \
464     tchi,\
465     self.param['tchi_min'],\
466     self.param['tchi_max'],\
467     ffr(os.path.dirname(self.fileout)))
468     return scripts
469         
470 def print_simi3d(self):
471     simi3d = self.parent.simi3dpanel
472     txt = '#Fichier genere par Iramuteq'
473     if simi3d.movie.GetValue() :
474         movie = "'" + ffr(os.path.dirname(self.DictPathOut['RData'])) + "'"
475     else :
476         movie = 'NULL'
477     
478     #if self.corpus.parametres['type'] == 'corpus' :
479     #    header = 'TRUE'
480     #else :
481     #    header = 'FALSE'
482     header = 'FALSE'
483     txt += """
484     dm<-read.csv2("%s",row.names=1,header = %s)
485     load("%s")
486     """ % (self.DictPathOut['Contout'], header, self.DictPathOut['RData'])
487     
488     txt += """
489     source("%s")
490     """ % self.parent.RscriptsPath['Rgraph']
491
492
493     txt += """
494     make.simi.afc(dm,chistabletot, lim=%i, alpha = %.2f, movie = %s)
495     """ % (simi3d.spin_1.GetValue(), float(simi3d.slider_1.GetValue())/100, movie)
496     tmpfile = tempfile.mktemp(dir=self.parent.TEMPDIR)
497     tmp = open(tmpfile,'w')
498     tmp.write(txt)
499     tmp.close()
500     return tmpfile
501
502 def dendroandbarplot(table, rownames, colnames, rgraph, tmpgraph, intxt = False, dendro=False) :
503     if not intxt :
504         txttable = 'c(' + ','.join([','.join(line) for line in table]) + ')'
505     rownb = len(rownames)
506     rownames = 'c("' + '","'.join(rownames) + '")'
507     colnames = 'c("' + '","'.join(colnames) + '")'
508     if not intxt :
509         #FIXME
510         txt = """
511             di <- matrix(data=%s, nrow=%i, byrow = TRUE)
512             rownames(di)<- %s
513             colnames(di) <- %s
514         """ % (txttable, rownb, rownames, colnames)
515     else :
516         txt = intxt
517     txt += """
518         load("%s")
519         library(ape)
520         source("%s")
521         height <- (30*ncol(di)) + (15*nrow(di))
522         height <- ifelse(height <= 400, 400, height)
523         width <- 500
524         open_file_graph("%s", width=width, height=height)
525         plot.dendro.lex(tree.cut1$tree.cl, di)
526         """ % (ffr(dendro),ffr(rgraph),  ffr(tmpgraph))
527     return txt
528
529 def barplot(table, rownames, colnames, rgraph, tmpgraph, intxt = False) :
530     if not intxt :
531         txttable = 'c(' + ','.join([','.join(line) for line in table]) + ')'
532     #width = 100 + (15 * len(rownames)) + (100 * len(colnames))
533     #height =  len(rownames) * 15
534     rownb = len(rownames)
535     #if height < 400 :
536     #    height = 400
537     rownames = 'c("' + '","'.join(rownames) + '")'
538     colnames = 'c("' + '","'.join(colnames) + '")'
539     if not intxt :
540         #FIXME
541         txt = """
542             di <- matrix(data=%s, nrow=%i, byrow = TRUE)
543             toinf <- which(di == Inf)
544             tominf <- which(di == -Inf)
545             if (length(toinf)) {
546                 di[toinf] <- NA
547                 valmax <- max(di, na.rm = TRUE)
548                 if (valmax <= 0) {
549                     valmax <- 2
550                 } else {
551                     valmax <- valmax + 2
552                 }
553                 di[toinf] <- valmax
554             }
555             if (length(tominf)) {
556                 di[tominf] <- NA
557                 valmin <- min(di, na.rm = TRUE)
558                 if (valmin >=0) {
559                     valmin <- -2
560                 } else {
561                     valmin <- valmin - 2
562                 }
563                 di[tominf] <- valmin
564             }
565             rownames(di)<- %s
566             colnames(di) <- %s
567         """ % (txttable, rownb, rownames, colnames)
568     else :
569         txt = intxt
570     txt += """
571         source("%s")
572         color = rainbow(nrow(di))
573         width <- 100 + (20*length(rownames(di))) + (100 * length(colnames(di)))
574         height <- nrow(di) * 15
575         if (height < 400) { height <- 400}
576         open_file_graph("%s",width = width, height = height)
577         par(mar=c(0,0,0,0))
578             layout(matrix(c(1,2),1,2, byrow=TRUE),widths=c(3,lcm(7)))
579         par(mar=c(2,2,1,0))
580         yp = ifelse(length(toinf), 0.2, 0)
581         ym = ifelse(length(tominf), 0.2, 0)
582         ymin <- ifelse(!length(which(di < 0)), 0, min(di) - ym)
583         coord <- barplot(as.matrix(di), beside = TRUE, col = color, space = c(0.1,0.6), ylim=c(ymin, max(di) + yp))
584         if (length(toinf)) {
585             coordinf <- coord[toinf]
586             valinf <- di[toinf]
587             text(x=coordinf, y=valinf + 0.1, 'i')
588         }
589         if (length(tominf)) {
590             coordinf <- coord[toinf]
591             valinf <- di[toinf]
592             text(x=coordinf, y=valinf - 0.1, 'i')
593         }            
594         c <- colMeans(coord)
595         c1 <- c[-1]
596         c2 <- c[-length(c)]
597         cc <- cbind(c1,c2)
598         lcoord <- apply(cc, 1, mean)
599         abline(v=lcoord)
600         if (min(di) < 0) {
601             amp <- abs(max(di) - min(di))
602         } else {
603             amp <- max(di)
604         }
605         if (amp < 10) {
606             d <- 2
607         } else {
608             d <- signif(amp%%/%%10,1)
609         }
610         mn <- round(min(di))
611         mx <- round(max(di))
612         for (i in mn:mx) {
613             if ((i/d) == (i%%/%%d)) { 
614                 abline(h=i,lty=3)
615             }
616         }
617         par(mar=c(0,0,0,0))
618         plot(0, axes = FALSE, pch = '')
619         legend(x = 'center' , rownames(di), fill = color)
620         dev.off()
621         """ % (rgraph, ffr(tmpgraph))    
622     return txt
623
624 #def RAfcUci(DictAfcUciOut, nd=2, RscriptsPath='', PARCEX='0.8'):
625 #    txt = """
626 #    library(ca)
627 #    nd<-%i
628 #    """ % nd
629 #    txt += """
630 #    dataact<-read.csv2("%s")
631 #    """ % (DictAfcUciOut['TableCont'])#, encoding)
632 #    txt += """
633 #    datasup<-read.csv2("%s")
634 #    """ % (DictAfcUciOut['TableSup'])#, encoding)
635 #    txt += """
636 #    dataet<-read.csv2("%s")
637 #    """ % (DictAfcUciOut['TableEt'])#, encoding)
638 #    txt += """
639 #    datatotsup<-cbind(dataact,datasup)
640 #    datatotet<-cbind(dataact,dataet)
641 #    afcact<-ca(dataact,nd=nd)
642 #    afcsup<-ca(datatotsup,supcol=((ncol(dataact)+1):ncol(datatotsup)),nd=nd)
643 #    afcet<-ca(datatotet,supcol=((ncol(dataact)+1):ncol(datatotet)),nd=nd)
644 #    afctot<-afcsup$colcoord
645 #    rownames(afctot)<-afcsup$colnames
646 #    colnames(afctot)<-paste('coord. facteur',1:nd,sep=' ')
647 #    afctot<-cbind(afctot,mass=afcsup$colmass)
648 #    afctot<-cbind(afctot,distance=afcsup$coldist)
649 #    afctot<-cbind(afctot,intertie=afcsup$colinertia)
650 #    rcolet<-afcet$colsup
651 #    afctmp<-afcet$colcoord[rcolet,]
652 #    rownames(afctmp)<-afcet$colnames[rcolet]
653 #    afctmp<-cbind(afctmp,afcet$colmass[rcolet])
654 #    afctmp<-cbind(afctmp,afcet$coldist[rcolet])
655 #    afctmp<-cbind(afctmp,afcet$colinertia[rcolet])
656 #    afctot<-rbind(afctot,afctmp)
657 #    write.csv2(afctot,file = "%s")
658 #    source("%s")
659 #    """ % (DictAfcUciOut['afc_row'], RscriptsPath['Rgraph'])
660 #    txt += """
661 #    PARCEX=%s
662 #    """ % PARCEX
663 #    #FIXME
664 #    txt += """
665 #    PlotAfc(afcet,filename="%s",toplot=c%s, PARCEX=PARCEX)
666 #    """ % (DictAfcUciOut['AfcColAct'], "('none','active')")
667 #    txt += """
668 #    PlotAfc(afcsup,filename="%s",toplot=c%s, PARCEX=PARCEX)
669 #    """ % (DictAfcUciOut['AfcColSup'], "('none','passive')")
670 #    txt += """PlotAfc(afcet,filename="%s", toplot=c%s, PARCEX=PARCEX)
671 #    """ % (DictAfcUciOut['AfcColEt'], "('none','passive')")
672 #    txt += """
673 #    PlotAfc(afcet,filename="%s", toplot=c%s, PARCEX=PARCEX)
674 #    """ % (DictAfcUciOut['AfcRow'], "('all','none')")
675 #    f = open(DictAfcUciOut['Rafcuci'], 'w')
676 #    f.write(txt)
677 #    f.close()
678
679 class PrintSimiScript(PrintRScript) :
680     def make_script(self) :
681         self.txtgraph = ''
682         self.packages(['igraph', 'proxy', 'Matrix'])
683         self.sources([self.analyse.parent.RscriptsPath['simi'], self.analyse.parent.RscriptsPath['Rgraph']])
684         txt = ''
685         if not self.parametres['keep_coord'] :
686             txt += """
687             dm.path <- "%s"
688             cn.path <- "%s"
689             selected.col <- "%s"
690             """ % (self.pathout['mat01.csv'], self.pathout['actives.csv'], self.pathout['selected.csv'])
691             txt += """
692             dm <-readMM(dm.path)
693             cn <- read.table(cn.path, sep=';', quote='"')
694             colnames(dm) <- cn[,1]
695             sel.col <- read.csv2(selected.col)
696             dm <- dm[, sel.col[,1] + 1]
697             """
698         else :
699             txt += """
700             load("%s")
701             """ % self.pathout['RData.RData']
702         
703         if self.parametres['coeff'] == 0 :
704             method = 'cooc'
705             if not self.parametres['keep_coord'] :
706                 txt += """
707                 method <- 'cooc'
708                 mat <- make.a(dm)
709                 """
710         else :
711             if not self.parametres['keep_coord'] :
712                 txt += """
713                 dm <- as.matrix(dm)
714                 """
715         if self.parametres['coeff'] == 1 :
716             method = 'prcooc'
717             txt += """
718             method <- 'Russel'
719             mat <- simil(dm, method = 'Russel', diag = TRUE, upper = TRUE, by_rows = FALSE)
720             """
721         elif self.analyse.indices[self.parametres['coeff']] == 'binomial' :
722             method = 'binomial'
723             if not self.parametres['keep_coord'] :
724                 txt += """
725                 method <- 'binomial'
726                 mat <- binom.sim(dm)
727                 """
728         elif self.parametres['coeff'] != 0 :
729             method = self.analyse.indices[self.parametres['coeff']]
730             if not self.parametres['keep_coord'] :
731                 txt += """
732                 method <-"%s"
733                 mat <- simil(dm, method = method, diag = TRUE, upper = TRUE, by_rows = FALSE)
734                 """ % self.analyse.indices[self.parametres['coeff']]
735         if not self.parametres['keep_coord'] :
736             txt += """
737             mat <- as.matrix(stats::as.dist(mat,diag=TRUE,upper=TRUE))
738             mat[is.na(mat)] <- 0
739             mat[is.infinite(mat)] <- 0
740             """
741         if self.parametres['layout'] == 0 : layout = 'random'
742         if self.parametres['layout'] == 1 : layout = 'circle'
743         if self.parametres['layout'] == 2 : layout = 'frutch'
744         if self.parametres['layout'] == 3 : layout = 'kawa'
745         if self.parametres['layout'] == 4 : layout = 'graphopt'
746
747
748         self.filename=''
749         if self.parametres['type_graph'] == 0 : type = 'tkplot'
750         if self.parametres['type_graph'] == 1 : 
751             graphnb = 1
752             type = 'nplot'
753             dirout = os.path.dirname(self.pathout['mat01'])
754             while os.path.exists(os.path.join(dirout,'graph_simi_'+str(graphnb)+'.png')):
755                 graphnb +=1
756             self.filename = ffr(os.path.join(dirout,'graph_simi_'+str(graphnb)+'.png'))
757         if self.parametres['type_graph'] == 2 : type = 'rgl'
758
759         if self.parametres['arbremax'] : 
760             arbremax = 'TRUE'
761             self.txtgraph += ' - arbre maximum'
762         else : arbremax = 'FALSE'
763         
764         if self.parametres['coeff_tv'] : 
765             coeff_tv = self.parametres['coeff_tv_nb']
766             tvminmax = 'c(NULL,NULL)'
767         elif not self.parametres['coeff_tv'] or self.parametres.get('sformchi', False) :
768             coeff_tv = 'NULL'
769             tvminmax = 'c(%i, %i)' %(self.parametres['tvmin'], self.parametres['tvmax'])
770         if self.parametres['coeff_te'] : coeff_te = 'c(%i,%i)' % (self.parametres['coeff_temin'], self.parametres['coeff_temax'])
771         else : coeff_te = 'NULL'
772         
773         if self.parametres['vcex'] or self.parametres.get('cexfromchi', False) :
774             vcexminmax = 'c(%i/10,%i/10)' % (self.parametres['vcexmin'],self.parametres['vcexmax'])
775         else :
776             vcexminmax = 'c(NULL,NULL)'
777         if not self.parametres['label_v'] : label_v = 'FALSE'
778         else : label_v = 'TRUE'
779
780         if not self.parametres['label_e'] : label_e = 'FALSE'
781         else : label_e = 'TRUE'
782         
783         if self.parametres['seuil_ok'] : seuil = str(self.parametres['seuil'])
784         else : seuil = 'NULL'
785             
786         cols = str(self.parametres['cols']).replace(')',', max=255)')
787         cola = str(self.parametres['cola']).replace(')',',max=255)')
788
789         txt += """
790         minmaxeff <- %s
791         """ % tvminmax
792         txt += """
793         vcexminmax <- %s
794         """ % vcexminmax
795         txt += """
796         cex = %i/10
797         """ % self.parametres['cex']
798
799         if self.parametres['film'] : 
800             txt += """
801             film <- "%s"
802             """ % self.pathout['film']
803         else : 
804             txt += """
805             film <- NULL
806             """
807         txt += """
808         seuil <- %s
809         """ % seuil
810         
811         txt += """
812         label.v <- %s
813         label.e <- %s
814         """ % (label_v, label_e)
815         txt += """
816         cols <- rgb%s
817         cola <- rgb%s
818         """ % (cols, cola)
819         txt += """
820         width <- %i
821         height <- %i
822         """ % (self.parametres['width'], self.parametres['height'])
823         if self.parametres['keep_coord'] :
824             txt += """
825             coords <- try(coords, TRUE)
826             if (!is.matrix(coords)) {
827                 coords<-NULL
828             }
829             """
830         else :
831             txt += """
832             coords <- NULL
833             """
834         txt += """
835         alpha <- %i/100
836         """ % self.parametres['alpha']
837         txt += """
838         alpha <- %i/100
839         """ % self.parametres['alpha']
840 #############################################
841         if  self.parametres.get('bystar',False) :
842             txt += """
843             et <- list()
844             """
845             for i, line in enumerate(self.parametres['listet']) :
846                 txt+= """
847                 et[[%i]] <- c(%s)
848                 """ % (i+1, ','.join([`val + 1` for val in line]))
849             txt+= """
850             unetoile <- c('%s')
851             """ % ("','".join([val for val in self.parametres['selectedstars']]))
852             txt += """
853             fsum <- NULL
854             rs <- rowSums(dm)
855             for (i in 1:length(unetoile)) {
856                 print(unetoile[i])
857                 tosum <- et[[i]]
858                 if (length(tosum) > 1) {
859                     fsum <- cbind(fsum, colSums(dm[tosum,]))
860                 } else {
861                     fsum <- cbind(fsum, dm[tosum,])
862                 }
863             }
864             source("%s")
865             lex <- AsLexico2(fsum, chip=TRUE)
866             dcol <- apply(lex[[4]],1,which.max)
867             toblack <- apply(lex[[4]],1,max)
868             gcol <- rainbow(length(unetoile))
869             #gcol[2] <- 'orange'
870             vertex.label.color <- gcol[dcol]
871             vertex.label.color[which(toblack <= 3.84)] <- 'black'
872             leg <- list(unetoile=unetoile, gcol=gcol)  
873             cols <- vertex.label.color
874             chivertex.size <- norm.vec(toblack, vcexminmax[1],  vcexminmax[2])
875             
876             """ % (self.analyse.parent.RscriptsPath['chdfunct'])
877         else :
878             txt += """
879             vertex.label.color <- 'black' 
880             chivertex.size <- 1
881             leg<-NULL
882             """
883 #############################################        
884
885 #        txt += """
886 #        eff <- colSums(dm)
887 #        g.ori <- graph.adjacency(mat, mode='lower', weighted = TRUE)
888 #        w.ori <- E(g.ori)$weight
889 #        if (max.tree) {
890 #            if (method == 'cooc') {
891 #                E(g.ori)$weight <- 1 / w.ori
892 #            } else {
893 #                E(g.ori)$weigth <- 1 - w.ori
894 #            }
895 #            g.max <- minimum.spanning.tree(g.ori)
896 #            if (method == 'cooc') {
897 #                E(g.max)$weight <- 1 / E(g.max)$weight
898 #            } else {
899 #                E(g.max)$weight <- 1 - E(g.max)$weight
900 #            }
901 #            g.toplot <- g.max
902 #        } else {
903 #            g.toplot <- g.ori
904 #        }
905 #        """
906         txt += """
907         eff <- colSums(dm)
908         x <- list(mat = mat, eff = eff)
909         graph.simi <- do.simi(x, method='%s', seuil = seuil, p.type = '%s', layout.type = '%s', max.tree = %s, coeff.vertex=%s, coeff.edge = %s, minmaxeff = minmaxeff, vcexminmax = vcexminmax, cex = cex, coords = coords)
910         """ % (method, type, layout, arbremax, coeff_tv, coeff_te)
911             
912         if self.parametres.get('bystar',False) :
913             if self.parametres.get('cexfromchi', False) :
914                 txt+="""
915                     label.cex<-chivertex.size
916                     """
917             else :
918                 txt+="""
919                 label.cex <- NULL
920                 """
921             if self.parametres.get('sfromchi', False) :
922                 txt += """
923                 vertex.size <- norm.vec(toblack, minmaxeff[1], minmaxeff[2])
924                 """
925             else :
926                 txt += """
927                 vertex.size <- NULL
928                 """
929         else :
930             #FIXME
931             tmpchi = False
932             if tmpchi :
933                 txt += """
934                 lchi <- read.table("%s")
935                 lchi <- lchi[,1]
936                 """ % ffr(tmpchi)
937                 if 'selected_col' in dir(self.tableau) :
938                     txt += """
939                     lchi <- lchi[c%s+1]
940                     """ % datas
941             if tmpchi and self.parametres.get('cexfromchi', False) :
942                 txt += """ 
943                 label.cex <- norm.vec(lchi, vcexminmax[1], vcexminmax[2])
944                 """
945             else :
946                 txt += """
947             if (is.null(vcexminmax[1])) {
948                 label.cex <- NULL
949             } else {
950                 label.cex <- graph.simi$label.cex
951             }
952             """
953             if tmpchi and self.parametres.get('sfromchi', False) :
954                 txt += """ 
955                 vertex.size <- norm.vec(lchi, minmaxeff[1], minmaxeff[2])
956                 """
957             else :
958                 txt += """
959             if (is.null(minmaxeff[1])) {
960                 vertex.size <- NULL
961             } else {
962                 vertex.size <- graph.simi$eff
963             }
964             """
965         txt += """ vertex.size <- NULL """
966         txt += """
967         coords <- plot.simi(graph.simi, p.type='%s',filename="%s", vertex.label = label.v, edge.label = label.e, vertex.col = cols, vertex.label.color = vertex.label.color, vertex.label.cex=label.cex, vertex.size = vertex.size, edge.col = cola, leg=leg, width = width, height = height, alpha = alpha, movie = film)
968         save.image(file="%s")
969         """ % (type, self.filename, self.pathout['RData'])
970         
971         self.add(txt)
972         self.write()
973
974 class WordCloudRScript(PrintRScript) :
975     def make_script(self) :
976         self.sources([self.analyse.parent.RscriptsPath['Rgraph']])
977         self.packages(['wordcloud'])
978         bg_col = Rcolor(self.parametres['col_bg'])
979         txt_col = Rcolor(self.parametres['col_text'])
980         txt = """
981         act <- read.csv2("%s", header = FALSE, row.names=1, sep='\t')
982         selected.col <- read.table("%s")
983         toprint <- as.matrix(act[selected.col[,1] + 1,])
984         rownames(toprint) <- rownames(act)[selected.col[,1] + 1]
985         maxword <- %i
986         if (nrow(toprint) > maxword) {
987             toprint <- as.matrix(toprint[order(toprint[,1], decreasing=TRUE),])
988             toprint <- as.matrix(toprint[1:maxword,])
989         }
990         open_file_graph("%s", width = %i, height = %i)
991         par(bg=rgb%s)
992         wordcloud(row.names(toprint), toprint[,1], scale=c(%f,%f), random.order=FALSE, colors=rgb%s)
993         dev.off()
994         """ % (ffr(self.analyse.pathout['actives_eff.csv']), ffr(self.analyse.pathout['selected.csv']), self.parametres['maxword'], ffr(self.parametres['graphout']), self.parametres['width'], self.parametres['height'], bg_col, self.parametres['maxcex'], self.parametres['mincex'], txt_col)
995         self.add(txt)
996         self.write()