...
[iramuteq] / configuration / corpus.cfg
index 327f4e8..06959bc 100644 (file)
@@ -1,12 +1,12 @@
 [corpus]
 corpus_name = 
-filename = test.txt
+filename = 
 originalpath =
 encoding = utf8
 lang = french
 douce = 1
-ucemethod = 0
-ucesize = 35
+ucemethod = 1
+ucesize = 40
 keep_ponct = 0
 tolist = 0
 etoile = 1
@@ -15,10 +15,12 @@ time =
 ucinb = 
 ucenb =
 occurrences = 
-keep_caract = ^a-zA-Z0-9àÃ\80âÃ\82äÃ\84áÃ\81éÃ\89èÃ\88êÃ\8aëÃ\8bìÃ\8cîÃ\8eïÃ\8fòÃ\92ôÃ\94öÃ\96ùÃ\99ûÃ\9büÃ\9cçÃ\87Ã\9fÅ\93Å\92â\80\99ñ.:,;!?*'_-
+keep_caract = ^a-zA-Z0-9àÃ\80âÃ\82äÃ\84áÃ\81Ã¥Ã\85ãéÃ\89èÃ\88êÃ\8aëÃ\8bìÃ\8cîÃ\8eïÃ\8fíÃ\8dóÃ\93òÃ\92ôÃ\94öÃ\96õÃ\95øÃ\98ùÃ\99ûÃ\9büÃ\9cúÃ\9açÃ\87Ã\9fÅ\93Å\92â\80\99ñÃ\91.:,;!?'_-
 lower = 1
 ucimark = 0
 expressions = 1
 apos = 1
 tiret = 1
 firstclean = 1
+charact = 1
+lem = 1