<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /></head><body style='font-size: 9pt; font-family: Verdana,Geneva,sans-serif'>
<p>Well, in the function xxx_build_more of FTS plugin, the data received in the original PDF, not the output of pdftotext</p>
<p>Can you clarify where do you put your log in the solr plugin , so I can check the situation in the xapian plugin ?</p>
<div id="signature"></div>
<p><br /></p>
<p id="reply-intro">On 2021-02-08 17:34, John Fawcett wrote:</p>
<blockquote type="cite" style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0">
<div class="pre" style="margin: 0; padding: 0; font-family: monospace"><br /><br />On 08/02/2021 15:22, Joan Moreau wrote:
<blockquote type="cite" style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0"><br />Well, thank you for the answer, but the actual issue is that data sent<br />by the decoder (stipulated in the conf file) is properly collected by<br />dovecot core, but /not/ sent to the plugin : the plugin receives the<br />original data.<br /><br />This is not linked to a particular plugin (xapian, solr, squat, etc..)<br />but seems to be a general issue of dovecot core<br /><br /><br /></blockquote>
<br />Hi Joan<br /><br />as far as I can see there's not a general issue in the dovecot core with<br />using the decoder. It works for me. I see the text extracted from PDF<br />sent to solr (I enable raw_log feature to see the actual data going over<br />) Also when I query solr I get a search hit for attachment text.<br /><br />John<br /><br /><br /></div>
</blockquote>
</body></html>