GNU/Linux >> Tutoriels Linux >  >> Linux

Trouvez n'importe quelle ligne dans VI qui a quelque chose d'autre que ATCG

Tout d'abord, vous ne voulez certainement pas ouvrir le fichier dans un éditeur (il est beaucoup trop volumineux pour être modifié de cette façon).

Au lieu de cela, si vous voulez simplement identifier si le fichier contient autre chose que A , T , C et G , vous pouvez le faire avec

grep '[^ATCG]' filename

Cela renverrait toutes les lignes contenant autre chose que ces quatre caractères.

Si vous souhaitez supprimer ces caractères du fichier, vous pouvez le faire avec

tr -c -d 'ATCG\n' <filename >newfilename

(si c'est la bonne façon de "corriger" le fichier ou non, je ne sais pas)

Cela supprimerait tous les caractères du fichier qui ne sont pas l'un des quatre, et il conserverait également les retours à la ligne (\n ). Le fichier édité serait écrit dans newfilename .

S'il s'agit d'une erreur systématique qui a ajouté quelque chose au fichier, cela pourrait éventuellement être corrigé par sed ou awk , mais nous ne savons pas encore à quoi ressemblent vos données.

Si vous avez le fichier ouvert en vi ou vim , puis la commande

/[^ATCG]

trouvera le caractère suivant dans le tampon d'édition qui n'est pas un A , T , C ou G .

Et :%s/[^ATCG]//g les supprimera tous.


Linux
  1. Comment trouver le package qui fournit un fichier spécifique sous Linux

  2. Est-il possible de trouver quel Vim/tmux a ouvert le fichier ?

  3. Utilitaire de ligne de commande pour récupérer le mot de passe, qui n'a pas d'écho en retour ?

  4. Trouver l'âge du fichier le plus ancien sur une ligne ou renvoyer zéro ?

  5. 4 outils pour télécharger n'importe quel fichier en utilisant la ligne de commande sous Linux

Comment trouver la ou les lignes les plus longues dans un fichier sous Linux

Un programme qui pourrait mettre en mémoire tampon Stdin ou File ?

Impossible de trouver le fichier à patcher sur la ligne d'entrée 3 ?

Comment pouvons-nous stocker un mot de passe autre que du texte brut ?

trouver les fichiers dont le numéro dans le nom de fichier est supérieur à

rechercher et supprimer un fichier ou un dossier de plus de x jours