pyocr - python pdf2image




Ottieni un'anteprima JPEG di un PDF su Windows? (2)

Ho un'applicazione multipiattaforma (Python) che deve generare un'anteprima JPEG della prima pagina di un PDF.

Sul Mac, sto generando sips . C'è qualcosa di altrettanto semplice che posso fare su Windows?


È possibile utilizzare l'utility di conversione di ImageMagick per questo, vedere alcuni esempi in http://studio.imagemagick.org/pipermail/magick-users/2002-May/002636.html :

Convert taxes.pdf taxes.jpg 

Converte un file PDF di due pagine in file [2] jpeg: taxes.jpg.0, tasse.jpg.1

Posso anche convertire questi JPEG in una miniatura come segue:

convert -size 120x120 taxes.jpg.0 -geometry 120x120 +profile '*' thumbnail.jpg

Posso persino convertire il PDF direttamente in una miniatura jpeg come segue:

convert -size 120x120 taxes.pdf -geometry 120x120 +profile '*' thumbnail.jpg

Ciò comporterà un thumbnail.jpg.0 e thumbnail.jpg.1 per le due pagine.


È probabile che il PC abbia installato Acrobat? Penso che Acrobat installi un'estensione della shell in modo che le anteprime della prima pagina di un documento PDF vengano visualizzate nella visualizzazione di anteprima di Esplora risorse. Puoi ottenere le miniature manualmente tramite l'API COM IExtractImage, che dovrai completare. VBAccelerator ha un esempio in C # che potresti portare a Python.





pdf