Existe-t-il un bon visualiseur PDF dans les sources Ubuntu qui me permet de sélectionner et de copier du texte ? Okular pour KDE est une excellente application, car elle dispose d'un nombre d'outils beaucoup plus important que Document Viewer. Je vois que les dépôts ont Okular, mais j'aimerais éviter d'installer toutes les dépendances KDE qui l'accompagnent. Cependant, tout ce que j'ai vraiment besoin de faire est de sélectionner et de copier du texte à partir d'un pdf. Qu'est-ce qui me permettra de faire cela ?
Réponse acceptée :
Comme mentionné dans un commentaire, si le texte d'un document pdf est sélectionnable sous forme de texte ou non, dépend si le texte est dans le document en tant qu'image ou sous forme de texte . Dans ce dernier cas, tous les pdf
les téléspectateurs prennent en charge la sélection de texte pour autant que je sache.
Pas d'options avec du texte dans une image pdf ?
Vous avez cependant quelques options pour rendre le texte d'un document "lisible"
Une option relativement inconnue, mais imo très agréable pour (aussi) convertir pdf
images en texte est gimageReader
:
Il a une interface agréable et lit le texte sélectionné, affiché à côté de votre document pdf.
pour l'installer, utilisez son ppa :
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader
Remarque
Vous pourriez avoir besoin/vouloir installer en plus tesseract
outils ocr pour les langues spécifiques à utiliser :
sudo apt-get install tesseract-ocr
et des langues spécifiques, par exemple
sudo apt-get install tesseract-ocr-eng
Des langues spécifiques peuvent également être facilement sélectionnées en utilisant synaptic
.
Modifier
(au moins) Depuis le 18.04, gImageReader est dans les dépôts, donc plus besoin d'ajouter le ppa manuellement.