windows
[iramuteq] / configuration / corpus.cfg
index 9452f14..06959bc 100644 (file)
@@ -1,6 +1,6 @@
 [corpus]
 corpus_name = 
-filename = test.txt
+filename = 
 originalpath =
 encoding = utf8
 lang = french
@@ -15,10 +15,12 @@ time =
 ucinb = 
 ucenb =
 occurrences = 
-keep_caract = ^a-zA-Z0-9àÃ\80âÃ\82äÃ\84áÃ\81Ã¥Ã\85ãéÃ\89èÃ\88êÃ\8aëÃ\8bìÃ\8cîÃ\8eïÃ\8fíÃ\8dòÃ\92ôÃ\94öÃ\96õÃ\95øÃ\98ùÃ\99ûÃ\9büÃ\9cúÃ\9açÃ\87Ã\9fÅ\93Å\92â\80\99ñ.:,;!?*'_-
+keep_caract = ^a-zA-Z0-9àÃ\80âÃ\82äÃ\84áÃ\81Ã¥Ã\85ãéÃ\89èÃ\88êÃ\8aëÃ\8bìÃ\8cîÃ\8eïÃ\8fíÃ\8dóÃ\93òÃ\92ôÃ\94öÃ\96õÃ\95øÃ\98ùÃ\99ûÃ\9büÃ\9cúÃ\9açÃ\87Ã\9fÅ\93Å\92â\80\99ñÃ\91.:,;!?'_-
 lower = 1
 ucimark = 0
 expressions = 1
 apos = 1
 tiret = 1
 firstclean = 1
+charact = 1
+lem = 1