Il y a xpdf qui inclut le pdftotext
binaire.
Pdftotext convertit les fichiers PDF (Portable Document Format) en texte brut.
Sous Linux, un programme d'installation est disponible. Il semble qu'il existe également dans le poppler-utils
forfait. Sur OS X, vous pouvez l'installer à l'aide de Homebrew (installez-le d'abord), puis utilisez
brew install homebrew/x11/xpdf
qui téléchargera les fichiers source et les compilera pour OS X. Après cela, utilisez-le simplement comme :
pdftotext your_pdf_file.pdf
qui générera un fichier texte brut. Il existe également quelques options, consultez man pdftotext
pour plus de détails.
Une alternative est poppler, sous OSX :
brew install poppler
dans Debian et ses amis
apt-get install poppler-utils