Il existe un certain nombre de lecteurs OCR pour Linux qui peuvent convertir une image en texte. Regardez les options suivantes :
- GOCR :page Wikipédia
- Ocrad :page Wikipédia
- ocropus :page Wikipédia
- tesseract-ocr :page Wikipédia
Tous les éléments ci-dessus, à l'exception d'ocropus, sont présents dans le référentiel Ubuntu dans un package du même nom.
Différents lecteurs prennent en charge différents formats d'image, vous pouvez donc être limité dans vos options par le format de fichier dans lequel se trouve votre document. Vous pouvez également utiliser l'outil de conversion d'ImageMagick pour modifier le format si vous souhaitez utiliser un lecteur OCR particulier.
Adapté de ma réponse ici.