GNU/Linux >> Tutoriels Linux >  >> Linux

Pourquoi uniq considère-t-il les mots identiques comme différents ?

Essayez de trier d'abord :

cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt

Ou utilisez "sort -u" qui élimine également les doublons. Voir ici.


La taille du fichier n'a rien à voir avec ce que vous voyez. À partir de la page de manuel de uniq(1) :

Remarque :'uniq' ne détecte pas les lignes répétées à moins qu'elles ne soient adjacentes. Vous pouvez d'abord trier l'entrée ou utiliser 'sort -u' sans 'uniq'. De plus, les comparaisons respectent les règles spécifiées par 'LC_COLLATE'.`

Exécutant donc uniq sur

a
b
a

renverra :

a
b
a

Linux
  1. Pourquoi un nouveau répertoire a-t-il un nombre de liens physiques de 2 avant que quoi que ce soit ne soit ajouté ?

  2. Utiliser Uniq sur le texte Unicode ?

  3. Pourquoi l'homme imprime-t-il "donne-moi, donne-moi, donne-moi" à 00h30 ?

  4. Linux - Pourquoi Setuid ne fonctionne-t-il pas ??

  5. Pourquoi l'option Ssh -t ajoute-t-elle Cr &Lf dans la sortie redirigée ?

Commande WC Linux pour compter le nombre de lignes, de mots et de caractères

Pourquoi `exit &` ne fonctionne pas ?

Pourquoi Ctrl + Flèche gauche ne saute-t-il pas les mots ?

Pourquoi Ls -l affiche-t-il une taille différente de Ls -s ?

Pourquoi la commande free et dmidecode affichent-elles des valeurs différentes pour la RAM ?

Pourquoi top affiche-t-il un nombre de cœurs différent de cpuinfo ?