dovecot-2.2: lib-fts: Updated Finnish/French stopword lists from...
dovecot at dovecot.org
dovecot at dovecot.org
Mon Apr 20 15:04:01 UTC 2015
details: http://hg.dovecot.org/dovecot-2.2/rev/5b7e0fbd2565
changeset: 18425:5b7e0fbd2565
user: Timo Sirainen <tss at iki.fi>
date: Mon Apr 20 18:02:31 2015 +0300
description:
lib-fts: Updated Finnish/French stopword lists from Lucene code.
Most importantly they added the licensing info to the files.
diffstat:
src/lib-fts/stopwords_fi.txt | 12 +++++++++---
src/lib-fts/stopwords_fr.txt | 10 ++++++++--
2 files changed, 17 insertions(+), 5 deletions(-)
diffs (50 lines):
diff -r aa0424c40ced -r 5b7e0fbd2565 src/lib-fts/stopwords_fi.txt
--- a/src/lib-fts/stopwords_fi.txt Mon Apr 20 17:45:32 2015 +0300
+++ b/src/lib-fts/stopwords_fi.txt Mon Apr 20 18:02:31 2015 +0300
@@ -1,4 +1,10 @@
-
+ | From svn.tartarus.org/snowball/trunk/website/algorithms/finnish/stop.txt
+ | This file is distributed under the BSD License.
+ | See http://snowball.tartarus.org/license.php
+ | Also see http://www.opensource.org/licenses/bsd-license.html
+ | - Encoding was converted to UTF-8.
+ | - This notice was added.
+
| forms of BE
olla
@@ -40,8 +46,8 @@
te teidän teidät teitä teissä teistä teihin teillä teiltä teille | you
he heidän heidät heitä heissä heistä heihin heillä heiltä heille | they
-tämä tämän tätä tässä tästä tähän tällä tältä tälle tänä täksi | this
-tuo tuon tuota tuossa tuosta tuohon tuolla tuolta tuolle tuona tuoksi | that
+tämä tämän tätä tässä tästä tähän tallä tältä tälle tänä täksi | this
+tuo tuon tuotä tuossa tuosta tuohon tuolla tuolta tuolle tuona tuoksi | that
se sen sitä siinä siitä siihen sillä siltä sille sinä siksi | it
nämä näiden näitä näissä näistä näihin näillä näiltä näille näinä näiksi | these
nuo noiden noita noissa noista noihin noilla noilta noille noina noiksi | those
diff -r aa0424c40ced -r 5b7e0fbd2565 src/lib-fts/stopwords_fr.txt
--- a/src/lib-fts/stopwords_fr.txt Mon Apr 20 17:45:32 2015 +0300
+++ b/src/lib-fts/stopwords_fr.txt Mon Apr 20 18:02:31 2015 +0300
@@ -1,3 +1,9 @@
+ | From svn.tartarus.org/snowball/trunk/website/algorithms/french/stop.txt
+ | This file is distributed under the BSD License.
+ | See http://snowball.tartarus.org/license.php
+ | Also see http://www.opensource.org/licenses/bsd-license.html
+ | - Encoding was converted to UTF-8.
+ | - This notice was added.
| A French stop word list. Comments begin with vertical bar. Each stop
| word is at the start of a line.
@@ -161,8 +167,8 @@
| Later additions (from Jean-Christophe Deschamps)
ceci | this
-cela | that (added 11 Apr 2012. Omission reported by Adrien Grand)
-celà | that (incorrect, though common)
+cela | that
+celà | that
cet | this
cette | this
ici | here
More information about the dovecot-cvs
mailing list