En utilisant Linux (Fedora, plus précisément) comme poste de travail principal, j'ai parfois remarqué d'étranges caractères non imprimables comme dans les captures d'écran suivantes (en bas à gauche dans la première image et en haut à gauche dans la deuxième image) :
Dans l'image ci-dessus, les caractères non imprimables sont apparus dans gnome-terminal avec bash shell. Je quittais le shell interactif ipython par un sys.stdin.close()
piratage.
Dans l'image ci-dessus, le personnage est apparu dans une page Web ouverte dans firefox, en particulier le fichier texte RFC 822, juste avant la table des matières de ce RFC.
Je suis curieux et je veux savoir ce qu'ils sont. J'en déduis qu'il s'agit d'une sorte de représentation d'Unicode. Ai-je raison? Si oui, où ce type de notation est-il défini ? Comment s'appelle-t-il ?
Réponse acceptée :
La boîte carrée est généralement destinée aux caractères absents de votre police actuelle. Le code à l'intérieur est un code de caractères UTF-8 à deux octets. Les terminaux modernes sont UTF8, vous pouvez donc l'obtenir si vous essayez de sortir des données binaires sur votre terminal. Il semble que vous ayez fait quelque chose de vraiment étrange avec votre python et que python ait généré des déchets à l'écran, qui ont été interprétés comme des caractères inconnus et vous avez obtenu des déchets utf-8. Vous pouvez toujours obtenir des ordures aléatoires similaires avec 'cat /dev/urandom'.