dovecot-2.2: lib-fts: Updated Finnish/French stopword lists from...

dovecot at dovecot.org dovecot at dovecot.org
Mon Apr 20 15:04:01 UTC 2015


details:   http://hg.dovecot.org/dovecot-2.2/rev/5b7e0fbd2565
changeset: 18425:5b7e0fbd2565
user:      Timo Sirainen <tss at iki.fi>
date:      Mon Apr 20 18:02:31 2015 +0300
description:
lib-fts: Updated Finnish/French stopword lists from Lucene code.
Most importantly they added the licensing info to the files.

diffstat:

 src/lib-fts/stopwords_fi.txt |  12 +++++++++---
 src/lib-fts/stopwords_fr.txt |  10 ++++++++--
 2 files changed, 17 insertions(+), 5 deletions(-)

diffs (50 lines):

diff -r aa0424c40ced -r 5b7e0fbd2565 src/lib-fts/stopwords_fi.txt
--- a/src/lib-fts/stopwords_fi.txt	Mon Apr 20 17:45:32 2015 +0300
+++ b/src/lib-fts/stopwords_fi.txt	Mon Apr 20 18:02:31 2015 +0300
@@ -1,4 +1,10 @@
-
+ | From svn.tartarus.org/snowball/trunk/website/algorithms/finnish/stop.txt
+ | This file is distributed under the BSD License.
+ | See http://snowball.tartarus.org/license.php
+ | Also see http://www.opensource.org/licenses/bsd-license.html
+ |  - Encoding was converted to UTF-8.
+ |  - This notice was added.
+ 
 | forms of BE
 
 olla
@@ -40,8 +46,8 @@
 te     teidän teidät teitä  teissä  teistä  teihin teillä  teiltä  teille                | you
 he     heidän heidät heitä  heissä  heistä  heihin heillä  heiltä  heille                | they
 
-tämä   tämän         tätä   tässä   tästä   tähän  tällä   tältä   tälle   tänä   täksi  | this
-tuo    tuon          tuota  tuossa  tuosta  tuohon tuolla  tuolta  tuolle  tuona  tuoksi | that
+tämä   tämän         tätä   tässä   tästä   tähän  tallä   tältä   tälle   tänä   täksi  | this
+tuo    tuon          tuotä  tuossa  tuosta  tuohon tuolla  tuolta  tuolle  tuona  tuoksi | that
 se     sen           sitä   siinä   siitä   siihen sillä   siltä   sille   sinä   siksi  | it
 nämä   näiden        näitä  näissä  näistä  näihin näillä  näiltä  näille  näinä  näiksi | these
 nuo    noiden        noita  noissa  noista  noihin noilla  noilta  noille  noina  noiksi | those
diff -r aa0424c40ced -r 5b7e0fbd2565 src/lib-fts/stopwords_fr.txt
--- a/src/lib-fts/stopwords_fr.txt	Mon Apr 20 17:45:32 2015 +0300
+++ b/src/lib-fts/stopwords_fr.txt	Mon Apr 20 18:02:31 2015 +0300
@@ -1,3 +1,9 @@
+ | From svn.tartarus.org/snowball/trunk/website/algorithms/french/stop.txt
+ | This file is distributed under the BSD License.
+ | See http://snowball.tartarus.org/license.php
+ | Also see http://www.opensource.org/licenses/bsd-license.html
+ |  - Encoding was converted to UTF-8.
+ |  - This notice was added.
 
  | A French stop word list. Comments begin with vertical bar. Each stop
  | word is at the start of a line.
@@ -161,8 +167,8 @@
 
                | Later additions (from Jean-Christophe Deschamps)
 ceci           |  this
-cela           |  that (added 11 Apr 2012. Omission reported by Adrien Grand)
-celà           |  that (incorrect, though common)
+cela           |  that
+celà           |  that
 cet            |  this
 cette          |  this
 ici            |  here


More information about the dovecot-cvs mailing list