Les archives et systèmes de compressions répondent à plusieurs types de besoins :
Archivage et sauvegarde : L'objectif est de grouper plusieurs fichier en un seul, avec ou sans compression. La qualité à rechercher est la pérennité, on favorisera donc les formats fiables, répandus, standards (de fait).
Compression pour faciliter une communication : L'objectif est d'économiser de la bande passante ou du temps de téléchargement. La qualité à rechercher est l'interopérabilité, pour que tous les correspondants potentiels puissent décompresser le document dans de bonnes conditions.
Compression pour archives personnelles : On pourra, dans ce cas, favoriser des formats compressant plus efficacement, éventuellement au prix d'un temps de compression important.
Quelques points à garder à l'esprit concernant l'archivage :
La loi de Moore, c'est à dire la multiplication rapide de la capacité des mémoires de masse, rend souvent inutile la compression.
Les CD et DVD usuels ne sont pas fiables au delà de dix ans. Il peut être utile de préférer une sauvegarde “vive” (sur disque dur) pour le plus long terme.
Les mémoires flash ne sont pas adaptées (à ce jour) pour l'archivage (il faut les alimenter régulièrement, en les plaçant dans un appareil).
Les données importantes doivent toujours être stockées en deux exemplaires au moins, sur deux supports différents.
Principaux formats de compression pure :
Z (logiciel Unix compress
) -
obsolète
zip (algorithme “deflate“) - courant sous Windows, intégré aux principaux navigateurs web
GZ (logiciel GnuZip) - courant sous Unix/Linux, intégré aux principaux navigateurs web
BZ2 (logiciel bzip2
) - surtout sous
Unix/Linux, celui qui compresse le plus (au prix du temps de
calcul de la compression), décompression rapide
Ces systèmes peuvent être employés pour compresser un fichier unique (par exemple une archive pure) ou une télécommunication (par exemple un échange entre serveur web et navigateurs).
Il ne faut pas confondre archivage et compression. L'archivage consiste à grouper plusieurs fichier en un seul. Certains format permettent de compresser les données en même temps, d'autres pas. Dans ce second cas, on peut combiner l'archivage avec un système de compression pur.
Principaux formats d'archives :
ar
- obsolète, pour les anciennes bandes
magnétiques
tar
- usuel sous Unix/Linux, ne compresse
pas, souvent combiné avec une compression (tgz
= tar.gz
, tz2
=
tar.bz2
)
zip - usuel sous Windows, la plupart des systèmes le comprennent nativement, intègre la compression
autres (à éviter, en général, pour des raisons d'interopérabilité et de pérennité) : ace, rar, 7-zip...