<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /></head><body style='font-size: 9pt; font-family: Verdana,Geneva,sans-serif'>
<p>In such case, as long as the API is not upgraded, should </p>
<p><span style="font-family: courier new, courier, monospace;">doveadm index -A -q \*</span></p>
<p>be considered a replacement of</p>
<p><span style="font-family: courier new, courier, monospace;">doveadm fts rescan</span><br /><br /></p>
<div id="signature"> </div>
<p><br /></p>
<p id="reply-intro">On 2019-02-14 16:24, Timo Sirainen via dovecot wrote:</p>
<blockquote type="cite" style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0"><!-- html ignored --><!-- head ignored --><!-- meta ignored -->Hi,
<div> </div>
<div>The rescan() function is a bit badly designed. Currently what you could do what fts-lucene does and:</div>
<div> - Get list of UIDs for all mails in each folder</div>
<div> - If Xapian has UID that doesn't exist -> delete it from Xapian</div>
<div> - If UID is missing from Xapian -> expunge the rest of the UIDs in that folder, so the next indexing will cause them to be indexed</div>
<div> </div>
<div>The expunging of rest of the mails is rather ugly, yes.. A better API would be if backend simply had a way to iterate all mails in the index, preferrably sorted by folder. Then a more generic code could go through them and expunge the necessary mails and index the missing mails. Although not all FTS backends support indexing in the middle. Anyway, we don't really have time to implement this new API soon.</div>
<div> </div>
<div>I'm not sure if this is a big problem though. I don't think most people running FTS have ever run rescan.</div>
<div> </div>
<div>
<div>
<blockquote type="cite" style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0">
<div>On 8 Feb 2019, at 9.54, Joan Moreau via dovecot <<a href="mailto:dovecot@dovecot.org" rel="noreferrer">dovecot@dovecot.org</a>> wrote:</div>
<br class="Apple-interchange-newline" />
<div>
<div style="font-size: 9pt; font-family: Verdana,Geneva,sans-serif;">
<p><br /></p>
<div id="signature"> </div>
<p>Hi,</p>
<p>THis is a core problem in Dovecot in my understanding.</p>
<p>In my opinion, the rescan in dovecot should send to the FTS plugin the list of "supposedly" indexed emails (UID), and the plugin shall purge the redundant UID (i..e UID present in the index but not in the list sent by dovecot) and send back the list of UID not in its indexes to dovecot, so Dovect can send one by one the missing emails</p>
<p><br /></p>
<p>WHat do you think ?</p>
<p><br /></p>
<p>-------- Original Message --------</p>
<table border="0" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<th align="right" valign="baseline" nowrap="nowrap">Subject:</th>
<td>[grosjo/fts-xapian] `doveadm fts rescan` removes all indices (#15)</td>
</tr>
<tr>
<th align="right" valign="baseline" nowrap="nowrap">Date:</th>
<td>2019-02-08 08:28</td>
</tr>
<tr>
<th align="right" valign="baseline" nowrap="nowrap">From:</th>
<td>Leonard Lausen <<a href="mailto:notifications@github.com" rel="noreferrer">notifications@github.com</a>></td>
</tr>
<tr>
<th align="right" valign="baseline" nowrap="nowrap">To:</th>
<td>grosjo/fts-xapian <<a href="mailto:fts-xapian@noreply.github.com" rel="noreferrer">fts-xapian@noreply.github.com</a>></td>
</tr>
<tr>
<th align="right" valign="baseline" nowrap="nowrap">Cc:</th>
<td>Subscribed <<a href="mailto:subscribed@noreply.github.com" rel="noreferrer">subscribed@noreply.github.com</a>></td>
</tr>
<tr>
<th align="right" valign="baseline" nowrap="nowrap">Reply-To:</th>
<td>grosjo/fts-xapian <<a href="mailto:reply+0022e607fd2eb3ff93959543198455bc7db5bdd58aa0286b92cf000000011874f1ae92a169ce185221c2@reply.github.com" rel="noreferrer">reply+0022e607fd2eb3ff93959543198455bc7db5bdd58aa0286b92cf000000011874f1ae92a169ce185221c2@reply.github.com</a>></td>
</tr>
</tbody>
</table>
<p><br /></p>
<p><code>doveadm fts rescan -A</code> deletes all indices, ie. all folders and files in the <code>xapian-indexes</code> are deleted. However, according to <code>man doveadm fts</code>, the <code>rescan</code> command should only</p>
<blockquote style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0;">
<p>Scan what mails exist in the full text search index and compare those to what<br />actually exist in mailboxes. This removes mails from the index that have already<br />been expunged and makes sure that the next doveadm index will index all the<br />missing mails (if any).</p>
</blockquote>
<p>Deleting all indices does not seem to be the intended action, especially as constructing the index anew may take very long on large mailboxes.</p>
<p style="font-size: small; -webkit-text-size-adjust: none; color: #666;">—<br />You are receiving this because you are subscribed to this thread.<br />Reply to this email directly, <a href="https://github.com/grosjo/fts-xapian/issues/15" target="_blank" rel="noopener noreferrer">view it on GitHub</a>, or <a href="https://github.com/notifications/unsubscribe-auth/ACLmB9OB-7GaKIvhNc8sCgi7KQTrjNnoks5vLScugaJpZM4auCWp" target="_blank" rel="noopener noreferrer">mute the thread</a>.<img src="https://github.com/notifications/beacon/ACLmB_N34_0jBEKj6zzSkBuGDIgXzvgJks5vLScugaJpZM4auCWp.gif" width="1" height="1" /></p>
<p><br /></p>
</div>
</div>
</blockquote>
</div>
</div>
</blockquote>
</body></html>