J'ai une situation où j'ai besoin d'extraire des images de nombreux fichiers PDF et de les afficher sur un site Web. Mes PDF contiennent des images "normales" ainsi que de nombreux graphiques.
J'ai utilisé pdf2xml et il extrait les images aux formats jpeg, ppm, pbm et vec. Je vois les images "régulières" extraites (pour la plupart) au format jpeg/ppm/pbm, mais je ne vois pas les graphiques s'y trouver - et je suppose donc que pdf2xml les stocke en tant que fichiers .vec.
La question est donc de savoir comment obtenir mes graphiques ? J'ai utilisé convert
qui vient avec imagemagick pour convertir .vec en jpeg/png etc mais en vain.
Réponse acceptée :
Je n'ai jamais essayé pdf2xml, mais en parcourant ses fichiers sur SourceForge, j'ai trouvé vec2svg-2.py, qui semble être un script Python pour convertir les fichiers .vec en .svg. Vous ne devriez avoir aucune difficulté à convertir SVG dans le format dont vous avez besoin.
python vec2svg-2.py -i file.vec -o file.svg