64k semble être un bon choix :
Results:
no bs= 78s 144584+0 records
bs=512 78s 144584+0 records
bs=1k 38s 72292+0 records
bs=2k 38s 36146+0 records
bs=4k 38s 18073+0 records
bs=5k 39s 14458+1 records
bs=50k 38s 1445+1 records
bs=500k 39s 144+1 records
bs=512k 39s 144+1 records
bs=1M 39s 72+1 records
bs=5M 39s 14+1 records
bs=10M 39s 7+1 records
(extrait d'ici).
cela correspond à mes propres découvertes concernant la mise en mémoire tampon en lecture/écriture pour accélérer un programme de conversion lourd en io que j'ai déjà proxénétisme @work.
dd se fera un plaisir de copier en utilisant le BS de ce que vous voulez, et copiera un bloc partiel (à la fin).
Fondamentalement, le paramètre de taille de bloc (bs) semble définir la quantité de mémoire utilisée pour lire un bloc d'un disque avant d'essayer d'écrire ce bloc sur l'autre.
Si vous avez beaucoup de RAM, rendre la BS volumineuse (mais entièrement contenue dans la RAM) signifie que le sous-système d'E/S est utilisé autant que possible en effectuant des lectures et des écritures massivement volumineuses - en exploitant la RAM. Réduire la taille de la BS signifie que la surcharge d'E/S en proportion de l'activité totale augmente.
Bien sûr, il y a une loi des rendements décroissants. Mon approximation approximative est qu'une taille de bloc dans la plage d'environ 128K à 32M va probablement donner des performances telles que les frais généraux sont faibles par rapport aux E/S simples, et augmenter la taille ne fera pas beaucoup de différence. La raison pour laquelle la limite inférieure est de 128K à 32M est - cela dépend de votre système d'exploitation, de votre matériel, etc.
Si c'était moi, je ferais quelques expériences chronométrant une copie/clone en utilisant un BS de 128K et en utilisant à nouveau (disons) 16M. Si l'on est sensiblement plus rapide, utilisez-le. Sinon, utilisez le plus petit BS des deux.
Comme d'autres l'ont dit, il n'y a pas de taille de bloc universellement correcte ; ce qui est optimal pour une situation ou un matériel peut être terriblement inefficace pour une autre. De plus, en fonction de la santé des disques, il peut être préférable d'utiliser une taille de bloc différente de ce qui est "optimal".
Une chose qui est assez fiable sur le matériel moderne est que la taille de bloc par défaut de 512 octets a tendance à être presque d'un ordre de grandeur plus lente qu'une alternative plus optimale. En cas de doute, j'ai trouvé que 64K est un défaut moderne assez solide. Bien que 64K ne soit généralement pas LA taille de bloc optimale, d'après mon expérience, il a tendance à être beaucoup plus efficace que la valeur par défaut. 64K a également une histoire assez solide de performances fiables :vous pouvez trouver un message de la liste de diffusion Eug-Lug, vers 2002, recommandant une taille de bloc de 64K ici :http://www.mail-archive.com/example@ unixlinux.online/msg12073.html
Pour déterminer LA taille de bloc de sortie optimale, j'ai écrit le script suivant qui teste l'écriture d'un fichier de test de 128 Mo avec dd dans une plage de tailles de bloc différentes, de la valeur par défaut de 512 octets à un maximum de 64 Mo. Soyez averti, ce script utilise dd en interne, donc utilisez-le avec prudence.
dd_obs_test.sh :
#!/bin/bash
# Since we're dealing with dd, abort if any errors occur
set -e
TEST_FILE=${1:-dd_obs_testfile}
TEST_FILE_EXISTS=0
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=1; fi
TEST_FILE_SIZE=134217728
if [ $EUID -ne 0 ]; then
echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi
# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'
# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
# Calculate number of segments required to copy
COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))
if [ $COUNT -le 0 ]; then
echo "Block size of $BLOCK_SIZE estimated to require $COUNT blocks, aborting further tests."
break
fi
# Clear kernel cache to ensure more accurate test
[ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches
# Create a test file with the specified block size
DD_RESULT=$(dd if=/dev/zero of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync 2>&1 1>/dev/null)
# Extract the transfer rate from dd's STDERR output
TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')
# Clean up the test file if we created one
if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi
# Output the result
printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done
Afficher sur GitHub
J'ai seulement testé ce script sur un système Debian (Ubuntu) et sur OSX Yosemite, il faudra donc probablement quelques ajustements pour qu'il fonctionne sur d'autres versions d'Unix.
Par défaut, la commande créera un fichier de test nommé dd_obs_testfile dans le répertoire courant. Vous pouvez également fournir un chemin vers un fichier de test personnalisé en indiquant un chemin après le nom du script :
$ ./dd_obs_test.sh /path/to/disk/test_file
La sortie du script est une liste des tailles de bloc testées et de leurs taux de transfert respectifs comme suit :
$ ./dd_obs_test.sh
block size : transfer rate
512 : 11.3 MB/s
1024 : 22.1 MB/s
2048 : 42.3 MB/s
4096 : 75.2 MB/s
8192 : 90.7 MB/s
16384 : 101 MB/s
32768 : 104 MB/s
65536 : 108 MB/s
131072 : 113 MB/s
262144 : 112 MB/s
524288 : 133 MB/s
1048576 : 125 MB/s
2097152 : 113 MB/s
4194304 : 106 MB/s
8388608 : 107 MB/s
16777216 : 110 MB/s
33554432 : 119 MB/s
67108864 : 134 MB/s
(Remarque :l'unité des taux de transfert varie selon le système d'exploitation)
Pour tester la taille optimale des blocs de lecture, vous pouvez utiliser plus ou moins le même processus, mais au lieu de lire depuis /dev/zero et d'écrire sur le disque, vous devez lire depuis le disque et écrire sur /dev/null. Un script pour faire cela pourrait ressembler à ceci :
dd_ibs_test.sh :
#!/bin/bash
# Since we're dealing with dd, abort if any errors occur
set -e
TEST_FILE=${1:-dd_ibs_testfile}
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=$?; fi
TEST_FILE_SIZE=134217728
# Exit if file exists
if [ -e $TEST_FILE ]; then
echo "Test file $TEST_FILE exists, aborting."
exit 1
fi
TEST_FILE_EXISTS=1
if [ $EUID -ne 0 ]; then
echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi
# Create test file
echo 'Generating test file...'
BLOCK_SIZE=65536
COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))
dd if=/dev/urandom of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync > /dev/null 2>&1
# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'
# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
# Clear kernel cache to ensure more accurate test
[ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches
# Read test file out to /dev/null with specified block size
DD_RESULT=$(dd if=$TEST_FILE of=/dev/null bs=$BLOCK_SIZE 2>&1 1>/dev/null)
# Extract transfer rate
TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')
printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done
# Clean up the test file if we created one
if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi
Afficher sur GitHub
Une différence importante dans ce cas est que le fichier de test est un fichier écrit par le script. Ne pointez pas cette commande sur un fichier existant ou le fichier existant sera écrasé par des données aléatoires !
Pour mon matériel particulier, j'ai trouvé que 128K était la taille de bloc d'entrée la plus optimale sur un disque dur et 32K était la plus optimale sur un SSD.
Bien que cette réponse couvre la plupart de mes découvertes, j'ai rencontré cette situation suffisamment de fois pour que j'écrive un article de blog à ce sujet :http://blog.tdg5.com/tuning-dd-block-size/ Vous pouvez trouver plus de détails sur les tests que j'y ai effectués.
Ce message StackOverflow peut également être utile :dd :comment calculer la taille de bloc optimale ?