<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Hi,<div class=""><br class=""></div><div class="">The rescan() function is a bit badly designed. Currently what you could do what fts-lucene does and:</div><div class=""> - Get list of UIDs for all mails in each folder</div><div class=""> - If Xapian has UID that doesn't exist -> delete it from Xapian</div><div class=""> - If UID is missing from Xapian -> expunge the rest of the UIDs in that folder, so the next indexing will cause them to be indexed</div><div class=""><br class=""></div><div class="">The expunging of rest of the mails is rather ugly, yes.. A better API would be if backend simply had a way to iterate all mails in the index, preferrably sorted by folder. Then a more generic code could go through them and expunge the necessary mails and index the missing mails. Although not all FTS backends support indexing in the middle. Anyway, we don't really have time to implement this new API soon.</div><div class=""><br class=""></div><div class="">I'm not sure if this is a big problem though. I don't think most people running FTS have ever run rescan.</div><div class=""><br class=""></div><div class=""><div><blockquote type="cite" class=""><div class="">On 8 Feb 2019, at 9.54, Joan Moreau via dovecot <<a href="mailto:dovecot@dovecot.org" class="">dovecot@dovecot.org</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" class=""><div style="font-size: 9pt; font-family: Verdana,Geneva,sans-serif" class=""><p class=""><br class=""></p>
<div id="signature" class=""> </div><p class="">Hi,</p><p class="">THis is a core problem in Dovecot in my understanding.</p><p class="">In my opinion, the rescan in dovecot should send to the FTS plugin the list of "supposedly" indexed emails (UID), and the plugin shall purge the redundant UID (i..e UID present in the index but not in the list sent by dovecot) and send back the list of UID not in its indexes to dovecot, so Dovect can send one by one the missing emails</p><p class=""><br class=""></p><p class="">WHat do you think ?</p><p class=""><br class=""></p><p class="">-------- Original Message --------</p>
<table border="0" cellspacing="0" cellpadding="0" class="">
<tbody class="">
<tr class="">
<th align="right" valign="baseline" nowrap="nowrap" class="">Subject:</th>
<td class="">[grosjo/fts-xapian] `doveadm fts rescan` removes all indices (#15)</td>
</tr>
<tr class="">
<th align="right" valign="baseline" nowrap="nowrap" class="">Date:</th>
<td class="">2019-02-08 08:28</td>
</tr>
<tr class="">
<th align="right" valign="baseline" nowrap="nowrap" class="">From:</th>
<td class="">Leonard Lausen <<a href="mailto:notifications@github.com" class="">notifications@github.com</a>></td>
</tr>
<tr class="">
<th align="right" valign="baseline" nowrap="nowrap" class="">To:</th>
<td class="">grosjo/fts-xapian <<a href="mailto:fts-xapian@noreply.github.com" class="">fts-xapian@noreply.github.com</a>></td>
</tr>
<tr class="">
<th align="right" valign="baseline" nowrap="nowrap" class="">Cc:</th>
<td class="">Subscribed <<a href="mailto:subscribed@noreply.github.com" class="">subscribed@noreply.github.com</a>></td>
</tr>
<tr class="">
<th align="right" valign="baseline" nowrap="nowrap" class="">Reply-To:</th>
<td class="">grosjo/fts-xapian <<a href="mailto:reply+0022e607fd2eb3ff93959543198455bc7db5bdd58aa0286b92cf000000011874f1ae92a169ce185221c2@reply.github.com" class="">reply+0022e607fd2eb3ff93959543198455bc7db5bdd58aa0286b92cf000000011874f1ae92a169ce185221c2@reply.github.com</a>></td>
</tr>
</tbody>
</table><p class=""><br class=""></p>
<!-- html ignored --><!-- head ignored --><!-- meta ignored --><p class=""><code class="">doveadm fts rescan -A</code> deletes all indices, ie. all folders and files in the <code class="">xapian-indexes</code> are deleted. However, according to <code class="">man doveadm fts</code>, the <code class="">rescan</code> command should only</p>
<blockquote type="cite" style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0" class=""><p class="">Scan what mails exist in the full text search index and compare those to what<br class="">actually exist in mailboxes. This removes mails from the index that have already<br class="">been expunged and makes sure that the next doveadm index will index all the<br class="">missing mails (if any).</p>
</blockquote><p class="">Deleting all indices does not seem to be the intended action, especially as constructing the index anew may take very long on large mailboxes.</p><p style="font-size: small; -webkit-text-size-adjust: none; color: #666;" class="">—<br class="">You are receiving this because you are subscribed to this thread.<br class="">Reply to this email directly, <a href="https://github.com/grosjo/fts-xapian/issues/15" target="_blank" rel="noopener noreferrer" class="">view it on GitHub</a>, or <a href="https://github.com/notifications/unsubscribe-auth/ACLmB9OB-7GaKIvhNc8sCgi7KQTrjNnoks5vLScugaJpZM4auCWp" target="_blank" rel="noopener noreferrer" class="">mute the thread</a>.<img src="https://github.com/notifications/beacon/ACLmB_N34_0jBEKj6zzSkBuGDIgXzvgJks5vLScugaJpZM4auCWp.gif" width="1" height="1" class=""></p>
<!-- script not allowed --><p class=""><br class=""></p>
<!-- script not allowed -->
</div>
</div></blockquote></div><br class=""></div></body></html>