GNU/Linux >> Tutoriels Linux >  >> Linux

Comment fonctionne Hexdump

Hexdump est un utilitaire qui affiche le contenu des fichiers binaires en hexadécimal, décimal, octal ou ASCII. C'est un utilitaire d'inspection et peut être utilisé pour la récupération de données, l'ingénierie inverse et la programmation.

Apprendre les bases

Hexdump fournit une sortie avec très peu d'effort de votre part et selon la taille du fichier que vous regardez, il peut y avoir beaucoup de sortie. Pour les besoins de cet article, créez un fichier PNG 1x1. Vous pouvez le faire avec une application graphique telle que GIMP ou Mtpaint, ou vous pouvez le créer dans un terminal avec ImageMagick.

Voici une commande pour générer un PNG 1x1 pixel avec ImageMagick :

$ convert -size 1x1 canvas:black pixel.png

Vous pouvez confirmer que ce fichier est un PNG avec le fichier commande :

fichier $ pixel.png
pixel.png :données d'image PNG, 1 x 1, niveaux de gris 1 bit, non entrelacées

Vous vous demandez peut-être comment le fichier commande est capable de déterminer de quel type de fichier il s'agit. Par coïncidence, c'est ce que hexdump révélera. Pour l'instant, vous pouvez afficher votre graphique à un pixel dans la visionneuse d'images de votre choix (il ressemble à ceci : . ), ou vous pouvez voir ce qu'il y a à l'intérieur du fichier avec hexdump :


0000010 0000 0100 0000 010001 0000 0000 010001 0000 0000 0100 000 0000 0000 024 0000 0000 0024 0024 0024 0000020 0024 000020 0024 0024 0024 0024 0024 0024 0024 0000020 0024 000020 0024 000020 0024 000004 4d41 0041 B100 0B8F 61FC
0000030 000 0000 0000 6320 5248 004D 7A00 0026 8000
0000040 0084 FA00 0000 0026 00E8 7500 0030 EA00
0000050 0060 3A00 0098 1700 9C70 51ba 003c 0000
0000060 6202 474B 0044 DD01 138A 00A4 0000 7407
0000070 4D49 0745 07E3 081A 3539 A487 467 46B0 0000
0000080 0A00 4449 5441 D708 6063 0000 0200 0100
0000090 21E2 33BC 0000 2500 4574 7458 6164 6574
00000A0 633A 6572 7461 0065 3032 3931 302D 2D37
00000B0 3532 3254 3A30 3731 3253A 2B33 3231 303A
00000C0 AC30 5DCD 00C1 0000 7425 5845 6474 7461
00000D0 3A65 6F6D 6964 7966 3200 3130 2D39 3730
00000E0 322D 5435 3032 353A 3A37 3335 312b 3a32
00000f0 3030 90dd 7de5 0000 0000 4549 444e 42ae
0000100 8260
0000102

Ce que vous voyez est le contenu de l'exemple de fichier PNG à travers un objectif que vous n'avez peut-être jamais utilisé auparavant. Ce sont exactement les mêmes données que vous voyez dans une visionneuse d'images, encodées d'une manière qui ne vous est probablement pas familière.

Extraire des chaînes familières

Ce n'est pas parce que le vidage des données par défaut semble dénué de sens qu'il est dépourvu d'informations précieuses. Vous pouvez traduire cette sortie ou au moins les parties qui se traduisent réellement, en un jeu de caractères plus familier avec le --canonical choix :

$ hexdump --canonical foo.png 
00000000  89 50 4e 47 0d 0a 1a 0a  00 00 00 0d 49 48 44 52  |.PNG........IHDR|
00000010 00 00 00 01 00 00 00 01  01 00 00 00 00 37 6e f9  |..............7n.|
00000020  24 00 00 00 04 67 41 4d  41 00 00 b1 8f 0b fc 61  |$....gAMA......a|
00000030  05 00 00 00 20 63 48 52  4d 00 00 7a 26 00 00 80  |.... cHRM..z&. ..|
00000040  84 00 00 fa 00 00 00 80  e8 00 00 75 30 00 00 ea  |...........u0...|
00000050  60 00 00 3a 98 00 00 17  70 9c ba 51 3c 00 00 00  |`..:....p..Q<...|
00000060  02 62 4b 47 44 00 01 dd  8a 13 a4 00 00 00 07 74  |.bKGD..........t|
00000070  49 4d 45 07 e3 07 1a 08  39 35 87 a4 b0 46 00 00  |IME.....95...F. .|
00000080  00 0a 49 44 41 54 08 d7  63 60 00 00 00 02 00 01  |..IDAT..c`......|
00000090  e2 21 bc 33 00 00 00 25  74 45 58 74 64 61 74 65  |.!.3...%tEXtdate|
000000a0  3a 63 72 65 61 74 65 00  32 30 31 39 2d 30 37 2d  |:create.2019-07-|
000000b0  32 35 54 32 30 3a 35 37  3a 35 33 2b 31 32 3a 30  |25T20:57:53+12:0|
000000c0  30 ac cd 5d c1 00 00 00  25 74 45 58 74 64 61 74  |0..]... % tEXtdat|
000000d0  65 3a 6d 6f 64 69 66 79  00 32 30 31 39 2d 30 37  |e:modify.2019-07|
000000e0  2d 32 35 54 32 30 3a 35 25 37 37 31 32 3a  |-25T20:57:53+12 :|
000000f0  30 30 jj 90 e5 7d 00 00  00 00 49 45 4e 44 ae 42  |00...}....IEND.B|
00000100  60 82                                             |`.|
00000102

Dans la colonne de droite, vous voyez les mêmes données que celles de gauche mais présentées en ASCII. Si vous regardez attentivement, vous pouvez sélectionner des informations utiles, telles que le format du fichier (PNG) et, vers le bas, la date et l'heure de création et de dernière modification du fichier. Les points représentent des symboles qui ne sont pas présents dans le jeu de caractères ASCII, ce qui est normal car les formats binaires ne sont pas limités aux lettres et aux chiffres banals.

Le fichier commande sait dès les 8 premiers octets quel est ce fichier. La spécification libpng alerte les programmeurs sur ce qu'il faut rechercher. Vous pouvez voir que dans les 8 premiers octets de ce fichier image, en particulier, se trouve la chaîne PNG . Ce fait est important car il révèle comment le fichier commande sait quel type de fichier signaler.

Vous pouvez également contrôler le nombre d'octets hexdump s'affiche, ce qui est utile avec des fichiers de plus d'un pixel :

$ hexdump --length 8 pixel.png 
0000000 5089 474e 0a0d 0a1a
0000008

Vous n'êtes pas obligé de limiter hexdump vers des fichiers PNG ou graphiques. Vous pouvez exécuter hexdump contre les fichiers binaires que vous exécutez quotidiennement, tels que ls, rsync ou tout autre format binaire que vous souhaitez inspecter.

Implémentation de cat avec hexdump

Le Terminal Linux

  • Les 7 meilleurs émulateurs de terminaux pour Linux
  • 10 outils de ligne de commande pour l'analyse de données sous Linux
  • Télécharger maintenant :Aide-mémoire SSH
  • Aide-mémoire des commandes Linux avancées
  • Tutoriels de ligne de commande Linux

Si vous lisez la spécification PNG, vous remarquerez peut-être que les données des 8 premiers octets sont différentes de ce que hexdump fournit. En fait, ce sont les mêmes données, mais elles sont présentées en utilisant une conversion différente. Ainsi, la sortie de hexdump est vrai, mais pas toujours directement utile pour vous, selon ce que vous recherchez. Pour cette raison, hexdump a des options pour formater et convertir les données brutes qu'il exporte.

Les options de conversion peuvent devenir complexes, il est donc utile de s'entraîner d'abord avec quelque chose de trivial. Voici une introduction en douceur au formatage hexdump sortie en réimplémentant le cat commande. Tout d'abord, lancez hexdump sur un fichier texte pour voir ses données brutes. Vous pouvez généralement trouver une copie de la licence GNU General Public License (GPL) quelque part sur votre disque dur, ou vous pouvez utiliser n'importe quel fichier texte que vous avez sous la main. Votre sortie peut différer, mais voici comment trouver une copie de la GPL sur votre système (ou au moins une partie de celle-ci) :

$ find /usr/share/doc/ -type f -name "COPYING" | tail -1
/usr/share/doc/libblkid-devel/COPYING

Exécutez hexdump contre elle :

666f 7774 7261 3B65 6565 7320 666F 7774 726F 3B65 7920
0000020 756F 6320 6574 6920 2074 6874
0000040 6964 6574 6D72 2074 6574 6D72 2073 666F 7420 6568 4720
0000060 554E 4C20 7365 6573 2072 6547 656E 6172
0000070 206C 7550 6C62 6369 4C0A 6369 6E65 6573
0000080 6120 2073 7570 6C62 7369 6568 2064 7962
[...]

Si la sortie du fichier est très longue, utilisez le --length (ou -n pour faire court) pour le rendre gérable par vous-même.

Les données brutes ne signifient probablement rien pour vous, mais vous savez déjà comment les convertir en ASCII :

hexdump --canonical /usr/share/doc/libblkid-devel/COPYING
00000000  54 68 69 73 20 6c 69 62  72 61 72 79 20 69 73 20  |Cette bibliothèque est |
00000010 66 72 65 65 20 73 6f 66  74 77 61 72 65 3b 20 79  |logiciel gratuit ; y|
00000020  6f 75 20 63 61 6e 20 72  65 64 69 73 74 72 69 62  |vous pouvez redistribuer|
00000030  75 74 65 20 69 74 20 61  6e 64 2f 6f 62 2f 6f 72 2 ute it and/or.mo|
00000040  64 69 66 79 20 69 74 20  75 6e 64 65 72 20 74 68  |dify it under th|
00000050  65 20 74 65 72 6d 73 20  6f 66 20 74 68 65 20 47  |e termes du G|
00000060  4e 55 20 4c 65 73 73 65  72 20 47 65 6e 65 72 61  |NU Petits Genres|
00000070  6c 20 50 6c 62 69 63  0a 4c 69 63 65 6e 73 65  |l Public.License|
[...]

Cette sortie est utile mais peu maniable et difficile à lire. Pour formater hexdump au-delà de ce qui est offert par ses propres options, utilisez --format (ou -e ) ainsi que des codes de formatage spécialisés. Le raccourci utilisé pour le formatage est similaire à ce que le printf commande utilise, donc si vous êtes familier avec printf déclarations, vous pouvez trouver hexdump mise en forme plus facile à apprendre.

Dans hexdump , la séquence de caractères %_p dit hexdump pour imprimer un caractère dans le jeu de caractères par défaut de votre système. Toutes les notations de mise en forme pour le --format l'option doit être entourée de guillemets simples :

$ hexdump -e'"%_p"' /usr/share/doc/libblkid-devel/COPYING
Cette bibliothèque est un logiciel fre*
; vous pouvez le redistribuer et/ou le modifier selon les termes de la Licence GNU Les*
er General Public, telle que publiée par la Fre*
 Software Foundation ; soit.la.version 2.1 de la Licence, soit (à votre choix) toute.version ultérieure..*
Le texte complet de la licence est disponible dans le..*
/Documentation/licenses/COPYING.LGPL -Fichier 2.1 ou ultérieur..

Cette sortie est meilleure, mais toujours peu pratique à lire. Traditionnellement, les fichiers texte UNIX supposent une largeur de sortie de 80 caractères (car il y a longtemps, les moniteurs avaient tendance à ne contenir que 80 caractères).

Bien que cette sortie ne soit pas liée par le formatage, vous pouvez forcer le hexdump pour traiter 80 octets à la fois avec des options supplémentaires. Plus précisément, en divisant 80 par un, vous pouvez dire hexdump pour traiter 80 octets comme une seule unité :

$ hexdump -e'80/1 "%_p"' /usr/share/doc/libblkid-devel/COPYING
Cette bibliothèque est un logiciel libre ; vous pouvez le redistribuer et/ou le modifier selon les termes de la licence GNU Lesser General Public, telle que publiée par la Free Software Foundation ; soit.la.version 2.1 de la Licence, soit (à votre choix) toute.version.ultérieure...Le texte complet de la licence est disponible dans le fichier.../Documentation/licenses/COPYING.LGPL-2.1-or-later. .

Maintenant, le fichier est traité en morceaux de 80 octets, mais il a perdu tout sens des nouvelles lignes. Vous pouvez ajouter le vôtre avec le \n caractère, qui sous UNIX représente une nouvelle ligne :

$ hexdump -e'80/1 "%_p""\n"'
Cette bibliothèque est un logiciel libre ; vous pouvez le redistribuer et/ou le modifier selon les termes de la Licence GNU Lesser General Public, telle que publiée par la Free Software Foundation ; soit.la.version 2.1 de la Licence, ou (à votre choix) toute version ultérieure.
version...Le texte complet de la licence est disponible dans le.../Documentation/
licenses/COPYING.LGPL -Fichier 2.1 ou ultérieur..

Vous avez maintenant (approximativement) implémenté le cat commande avec hexdump formatage.

Contrôle de la sortie

Le formatage est, de manière réaliste, la façon dont vous faites hexdump utile. Maintenant que vous êtes familiarisé, en principe au moins, avec hexdump formatage, vous pouvez faire la sortie de hexdump -n 8 correspondre à la sortie de l'en-tête PNG comme décrit par la libpng officielle spéc.

Tout d'abord, vous savez que vous voulez hexdump pour traiter le fichier PNG en morceaux de 8 octets. De plus, vous savez peut-être par reconnaissance d'entiers que la spécification PNG est documentée en décimal, qui est représenté par %d selon le hexdump documents :

$ hexdump -n8 -e'8/1 "%d""\n"' pixel.png
13780787113102610

Vous pouvez rendre la sortie parfaite en ajoutant un espace après chaque entier :

$ hexdump -n8 -e'8/1 "%d ""\n"' pixel.png
137 80 78 71 13 10 26 10

La sortie correspond désormais parfaitement à la spécification PNG.

Hexdumping pour le plaisir et le profit

Hexdump est un outil fascinant qui non seulement vous en apprend plus sur la façon dont les ordinateurs traitent et convertissent les informations, mais aussi sur le fonctionnement des formats de fichiers et des binaires compilés. Vous devriez essayer d'exécuter hexdump sur des fichiers au hasard tout au long de la journée pendant que vous travaillez. Vous ne savez jamais quels types d'informations vous pouvez trouver, ni quand ces informations peuvent être utiles.


Linux
  1. Comment utiliser la commande Linux Hexdump avec des exemples pratiques

  2. Comment changer la longueur de ligne par défaut pour Od et Hexdump ?

  3. Comment fonctionne la commande Tee ? ?

  4. Comment fonctionne "chmod -R 755"

  5. Comment ouvrir un nouveau terminal dans le répertoire courant ?

Comment effectuer une recherche dans Nano

Comment installer OmniOS ce

Comment fonctionne le programme ping sous Linux

Comment Fail2ban fonctionne sur Plesk

Qu'est-ce que DHCP et comment fonctionne DHCP ? (Les bases de DHCP expliquées)

Comprendre le fonctionnement d'un système de messagerie