Cette fonctionnalité est appelée déduplication . Aucun des systèmes de fichiers Linux populaires (ext *) ne le prend en charge, mais apparemment, ZFS le prend partiellement en charge. Il existe également un tableau des systèmes de fichiers répertoriant, entre autres, la déduplication, mais il ne semble pas y avoir de choix populaires ; il s'agit cependant d'une fonctionnalité prévue pour Btrfs.
Je suppose que vérifier périodiquement votre système de fichiers et créer des liens physiques appropriés est le mieux que vous puissiez faire pour le moment, bien que cela n'implique pas la copie sur écriture.
Le mot-clé principal que vous souhaitez rechercher est "copie sur écriture". BTRFS a une opération de clonage qui fait exactement ce que vous voulez, et cp --reflink
fera ce que vous cherchez, à condition que votre système dispose d'un noyau suffisamment moderne et de coreutils 7.5. Wiki Source De plus, bedup est un outil qui fusionnera les doublons sur un volume entier. CoW est également l'élément moteur de la technologie d'instantané de btrfs, IIRC.
Il existe un système de fichiers en ligne S3QL conçu pour les sauvegardes avec une grande capacité de déduplication.