<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /></head><body style='font-size: 9pt; font-family: Verdana,Geneva,sans-serif'>
<p>If I place the following code in the plugin fts_backend_xxx_update_build_more function (lucene, squat and xapian, as solr refuses to work properly on my setup)</p>
<p><span style="font-family: 'courier new', courier, monospace;">        {</span><br /><span style="font-family: 'courier new', courier, monospace;">                char * s = i_strdup("EMPTY");</span><br /><span style="font-family: 'courier new', courier, monospace;">                if(data != NULL) { i_free(s); s = i_strndup(data,20); }</span><br /><span style="font-family: 'courier new', courier, monospace;">                i_info("fts_backend_update_build_more: data like '%s'",s);</span><br /><span style="font-family: 'courier new', courier, monospace;">                i_free(s);</span><br /><span style="font-family: 'courier new', courier, monospace;">        }</span></p>
<p>and if I send a PDF by email, the data shown in the log is "%PDF-1.7 "</p>
<p>so it does mean the decoder data is not properly transmitted to the plugin</p>
<p>Something is wrong in the data transmission</p>
<p><br /></p>
<div id="signature"></div>
<p><br /></p>
<p id="reply-intro">On 2021-02-09 11:58, John Fawcett wrote:</p>
<blockquote type="cite" style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0">
<div class="pre" style="margin: 0; padding: 0; font-family: monospace">On 08/02/2021 23:05, Stuart Henderson wrote:
<blockquote type="cite" style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0">On 2021/02/08 21:33, Joan Moreau wrote:
<blockquote type="cite" style="padding: 0 0.4em; border-left: #1010ff 2px solid; margin: 0">Yes , once again : output of the decoder is fine, I also put log inide the dovecot core to<br />check whether data is properly transmitted, and result is that it is (i.e. dovecot core<br />receives the proper output of pdftotext via the decoder<br /><br />Now, that data is the /not/ the one sent from dovecot core to the fts plugin (and this is the<br />same issue for solr and all other plugins)</blockquote>
Seems that something is different with your setup than John's and mine<br />then, as fts_solr rawlog (which is just the http request split into<br />.in and .out files) has the decoded file for us.<br /><br />Did you try with the actual fts_solr plugin so it's a direct comparison<br />with what we see? There is no need for a real solr server, just point it<br />at any http server (or I guess netcat listening on a port will also do)<br />with<br /><br />mail_plugins = fts fts_solr<br /><br />plugin {<br />  fts_autoindex = yes<br />  fts = solr<br />  fts_solr = url=<a href="http://127.0.0.1:80/" target="_blank" rel="noopener noreferrer">http://127.0.0.1:80/</a> rawlog_dir=/tmp/solr<br />}<br /><br />If that is not showing decoded for you then I suppose there's some<br />problem on the way into/through fts. And if it does show as decoded<br />then perhaps fts_solr is doing something slightly different than the<br />places you're examining in fts and your plugin, and that might give<br />a point to work backwards from.<br /><br /></blockquote>
I'd also recommend Joan to look into some of the potential configuration<br />issues I mentioned in my first reply and if the problem persists, post<br />some clear evidence.<br /><br />John<br /><br /><br /><br /></div>
</blockquote>
</body></html>