!L'archivage tend de plus en plus à être utilisé pour tous les documents, quels qu'en soient la nature et le support, et a remplacé « conservation ». Il y a quelques dizaines d'années, seul le papier existait comme support d'enregistrement et de sauvegarde.
Un document n'était archivé que si toutes les informations avaient été traitées, c'est-à-dire lorsque le document était en fin de cycle de vie. La tendance actuelle est d'archiver les documents dès leur création et de les enrichir d'informations tout au long du cycle de vie.
Il convient de bien distinguer l’archivage :
du stockage, qui s’apparente aux actions, outils et méthodes permettant d’entreposer des contenus électroniques et servant de base au traitement ultérieur des contenus, ce stockage peut être réalisé sur divers supports tels que les cd-rom dont la vie des données sera limitée de 2 à 10 ans pour les cd-rom originaux et de 2 à 5 ans pour les cd-rom gravés. Quant au stockage sur disque dur ou serveur, la qualité du matériel joue un rôle non négligeable dans la durée de vie.
de la sauvegarde, qui est l’ensemble des actions, outils et méthodes destinés à dupliquer des contenus électroniques d'origine dans un but sécuritaire pour éviter leur perte en cas de dysfonctionnement du dispositif sur lequel ils sont enregistrés (dans le cas de plan de reprise d'activité ou de continuité d'activité -. Le contenu sauvegardé n’est pas considéré comme figé et peut donc être modifié ou remplacé. La durée de la sauvegarde est fonction de sa périodicité et porte le plus souvent sur du court terme.
Il existe deux types de support de stockage : le stockage de masse dont l'objectif est de stocker une quantité d'information à long terme et le stockage à accès rapide.Ce dernier, aussi appelé mémoire de travail, permet de stocker temporairement les données sur le support (mémoire vive RAM, mémoire morte ROM et les mémoires EPROM et EEPROM).
Désarchivage
Le désarchivage permet d'éliminer toutes celles devenues obsolètes et inutiles à conserver.
Ceci permet d'économiser les superficies de stockage.
Il peut recourir au déstockage d’archives, ou à la destruction des documents confidentiels.
Cependant, le désarchivage peut engendre des frais .
Les désarchivage peut aussi bien concerner les comptes rendus médicaux, documents confidentiels, détruits par broyage, ou les radiographies désargentées selon un processus enzymatique.
Supports d'archivage
Les supports de stockage de masse d'archives peuvent être magnétique (bande magnétique), optique (Cd et Dvd), magnéto-optique (disque magnéto-optique) ou encore électronique (disque dur, serveur de stockage réseau NAS)
Les supports de stockage temporaire les plus retrouvés en 2014 sont ceux de quatrième génération (clés USB, cartes SD, cartes microSD, etc).
L’archivage de contenus électroniques est l’ensemble des actions, outils et méthodes mis en œuvre pour réunir, identifier, sélectionner, classer et conserver des contenus électroniques, sur un support sécurisé, dans le but de les exploiter et de les rendre accessibles dans le temps, que ce soit à titre de preuve (en cas d’obligations légales notamment ou de litiges) ou à titre informatif. Le contenu archivé est considéré comme figé et ne peut donc être modifié. Ceci est notamment possible en garantissant l'authenticité via l’empreinte électronique, la signature électronique, la traçabilité des accès et bien d'autres moyens. La durée de l’archivage est fonction de la valeur du contenu et porte le plus souvent sur du moyen ou long terme. La conservation est l’ensemble des moyens mis en œuvre pour stocker, sécuriser, pérenniser, restituer, tracer, transférer voire détruire, les contenus électroniques archivé (Voir infographie)
L'interopérabilité et le partage des sources sont fondamentaux. Le plus souvent l'outil devra communiquer et partager des ressources avec d'autres applications. De même, il est important de prévoir, dès le départ, une notion de réversibilité de l'information dans le cas d'un changement du système ultérieur.
Les systèmes d’indexation pourront être intéressants en cas de hiérarchisation ou de recherches en cascade notamment en termes de présentation des résultats.
Le temps d'accès est un critère de choix dépendant largement des besoins de chaque entreprise.
L’accès sécurisé peut être un critère à prendre en compte, notamment dans le cas de données confidentielles (données médicales ou administratives).
Les formats des fichiers doivent être compatibles entre systèmes, notamment dans le cas d’une migration de données.
Le stockage devra être pris en compte selon les besoins de l'utilisateur : en ligne (online), en différé (offline), en léger différé (nearline) ou en panachage.
L’évolutivité des systèmes devra assurer la compatibilité avec les systèmes antérieurs.
Fichiers d'archive en informatique
Ce terme est utilisé en informatique pour la réunion en un seul fichier de nombreux autres fichiers. Ce fichier d'archive se prête à la mise à jour, au stockage ou au transfert par réseau.
Pour reconstruire un fichier informatique, on utilise un système (un programme) qui manipule l'enregistrement numérique, le catalogage et l'indexation.
Différents types de fichiers sont couramment utilisés : fichiers texte ( .txt, .odt, .doc, etc), fichiers musique ou son (.mp3, .wma, .aac, .ogg, .wav, etc), fichiers image ( .jpeg, .png, .bmp, etc), fichiers vidéo ( .avi, .mov, .divx, etc).
L'archivage peut être simple (format tar, par exemple), ou bien combiné avec du compactage de type:
.TAR : Tape ARchive format défini par POSIX 1003.1-2001,
.GZ : format de fichier GZIP,
.ZIP : spécification "ouverte" de PKWARE,
.RAR : Roshal ARchive, format propriétaire, inventé par Eugène Roshal, efficace pour découper des fichiers,
.BZ2 : algorithme de compression efficace, utilisé pour la diffusion des logiciels UNIX,
.ACE : format de fichier de compression, semblable aux RAR et ZIP,
.DAR : Disque Archive.
Pour une archive informatique de longue durée, il est important de s'assurer autant que possible de l'indépendance de l'information par rapport à son format : par exemple pour des données archivées pour 20 ans, il est préférable de stocker l'information sous forme de texte brut (.txt ou autre), plutôt que dans un format natif pour lequel le programme associé risque de ne plus être disponible, ou dont le système d'exploitation ne sera plus opérationnel. On parlera dans ce cas d'obsolescence technologique faisant référence à l'obsolescence de type matérielle, logiciel ou de format de fichier. Pour pérenniser l’archivage électronique, il est envisageable de procéder à des copies multiples de documents ou fichiers archivés, en diversifiant les technologies de stockage. Un moyen d’éviter la disparition des formats fichier est de choisir des formats durables, libre d’accès.
Archivage électronique en France
Lois et règlements
L'archivage électronique de documents est régi par :
des règles de droit, en vertu desquelles les archives peuvent avoir valeur de preuve,
des normes techniques,
des règles de droit protégeant la vie privée, notamment par l'organisation d'un "droit à l'oubli".
Législation relative à l'archivage
Les informations qui suivent ne s'appliquent pas totalement aux archives publiques électroniques, qui sont soumises à des obligations spécifiques de conservation et de versement dans un service d'archives public. La destruction d'archives publiques sous quelque forme qu'elles se présentent sans autorisation de l'administration des archives est un délit.
La loi du 13 mars 2000 contient plusieurs dispositions relatives au droit de la preuve aux technologies de l’information et à la signature électronique. Elle modifie le Code civil français : l'article 1316-1 (version en vigueur) admet l'écrit sous forme électronique comme preuve au même titre que l'écrit sur support papier sous réserve que puisse être dûment identifiée la personne dont il émane et à condition qu'il soit conservé dans des conditions de nature à en garantir l'intégrité. L'article 1348 (version en vigueur) précise ce qu'est une copie faisant foi. L’arrêt de la Cour de cassation, deuxième chambre civile, en date du 4 décembre 2008 reconnait également la valeur probante d’un document électronique. Cet arrêt confirme que l’écrit numérique doit respecter les termes définis par les articles précédents soit une reproduction fidèle et durable de la version originale papier. De plus, l’écrit numérique doit être horodaté au moment de sa numérisation et se présenter sous un format non modifiable. Si toutes ces conditions sont respectées, le document numérisé peut être conservé à la place du document papier.
L'article L134-2 du code de la consommation (version en vigueur), introduit par la loi pour la confiance dans l’économie numérique en juin 2004, impose l'archivage d'un écrit prouvant l'existence de tout contrat établi sous forme électronique et portant sur une somme supérieure à une certaine limite. Cette limite a été fixée à 120 euros par le décret n°2005-137 du 16 février 2005 (version en vigueur). Cette disposition, qui concerne en particulier les sites Internet de commerce électronique, vise à faciliter le règlement des litiges. La durée de conservation des documents comptables reste cependant fixée à 10 ans (article L123-22 du code de commerce version en vigueur) depuis 2003, ce qui depuis 2008 ne correspond plus aux délais de prescription extinctive en matière civile.
Les articles 289 et suivants du code général des impôts fixent les règles relatives à l'établissement des factures, notamment sous forme électronique, mais ne disposent nullement quant à leur durée de conservation.
Normes en usage
De nombreuses normes fournissent aux organisations une marche à suivre pour assurer l'archivage des documents, mais elles n'ont par définition aucun caractère obligatoire :
NF Z 42-013, publiée en 1999, est la plus connue en France. Elle précise des procédures techniques et organisationnelles permettant de garantir l'intégrité des documents lors de leur enregistrement, de leur stockage et de leur restitution. La norme a été publiée à une époque où l'écrit électronique ne pouvait constituer qu'un commencement de preuve et non une preuve de même niveau que l'écrit sous forme papier (art. 1316-1 du Code civil). Une nouvelle version a été adoptée le 4 février 2009.
ISO 14**1-1, datée de janvier 2012 définit les spécifications pour la mise en œuvre d'un Système d'archivage électronique. Elle est entièrement basée sur la norme NF Z42-013 dans sa révision de 2009 par le conseil administratif de L’Association française de normalisation (l’AFNOR).
NF Z 43-400, homologuée le 20 août 2005, traite des COM (acronyme de Computer Output Microform) ; désignant le procédé de stockage sur microformes ; et des COLD (acronyme de Computer Output Laser Disc) ; désignant le procédé de stockage sur disques laser.
ISO 14721:2003 (Systèmes de transfert des informations et données spatiales - Système ouvert d’archivage de l’information - Modèle de référence) est une transposition de l'OAIS (Open Archive Information System), modèle conceptuel destiné à la gestion, à l'archivage et à la préservation longue de documents numériques. Cette norme a été révisée par l’ISO 14721 : 2012.
L’archivage du web
Depuis 2006, la Bibliothèque nationale de France (BnF) collecte, conserve et communique les sites de l’Internet du « domaine français » (sites en .fr, extensions liées au territoire .re, sites en .com ou .org dans le cas d’une production des contenus en France ou dans le cas d’auteurs domiciliés en France) au titre du dépôt légal (d’après le Code du patrimoine, articles L131-1 à L133-1 et R131.1 à R133-1). Cet archivage est réalisé à l’aide de robots capturant à intervalles réguliers des échantillons représentatifs du web français (copies d’images, de pages, d’animations, de fichiers audio et vidéo). Ces collectes d’informations peuvent être larges (une fois par an) ou plus ciblées (archivage approfondi ou plus fréquent).
Le « droit à l'oubli »
Aujourd'hui, les internautes exposent largement leur vie sur Internet. Beaucoup d'entre eux, souvent les plus jeunes, partagent et publient des informations personnelles comme des photos, des vidéos sur des réseaux sociaux ou des commentaires permettant de les identifier sur des forums de discussion. Parfois, ces informations sont publiées sans l'accord des personnes concernées. Les internautes souhaitent, toutefois, mieux maîtriser les informations qui circulent sur Internet à leur sujet.
Dans une interview à France Info, Isabelle Falque-Pierrotin, Présidente de la Commission nationale de l'informatique et des libertés (CNIL), explique que « le droit à l’oubli sur internet, c’est la volonté et la possibilité pour chacun d’entre nous de maitriser ses traces numériques et sa vie privée et publique en ligne ».
Elle explique qu’au cours du temps, les internautes sont susceptibles de changer d’avis, d’évoluer ou de murir. Cependant une information, mise en ligne sur internet, reste figée dans le temps et peut rester diffusée plusieurs années après sa publication. Il est facile de retrouver cette information sur une personne en interrogeant un moteur de recherche à partir de son nom et prénom. Le droit à l’oubli est donc la volonté de supprimer une information dépassée dans le temps.
La CNIL reçoit de plus en plus de plaintes relatives au droit à l’oubli numérique. En 2012, sur 6 000 plaintes déposées, 1 000 concernaient le droit à l’oubli avec une croissance de plus de 42 % en 2013. Celles-ci concernent essentiellement des suppressions de propos injurieux, des publications de vidéos/photos intimes, des commentaires politiques pour la recherche d’un emploi ou encore des informations sur un état de santé.
La loi « Informatique et Liberté » permet à toute personne, qui justifie de son identité et qui présente des motifs légitimes, de s’opposer à la diffusion de ces données personnelles sur internet. Les démarches pour supprimer un contenu auprès d’un webmaster est de faire état de motifs légitimes, de justifier l’atteinte portée à la réputation ou à la vie privée après publication. Il est également possible de demander la suppression d’informations inexactes ou périmées et la rectification d’informations personnelles incomplètes. Le responsable du site peut supprimer la page ou retirer toute référence à l’identité en anonymisant le texte, en floutant la photographie ou encore en déréférençant la page du site, c’est-à-dire supprimer le lien entre l’identité et la page du site concerné. La CNIL explique aux internautes la procédure à suivre.
Le responsable du site doit donner une réponse dans un délai de deux mois, sinon il y a la possibilité de porter plainte en ligne. La CNIL relaie alors la demande auprès du responsable du site.
Au niveau européen, dans le cadre du projet du règlement européen sur les données personnelles, publié en 2012, la CNIL a participé dans l’idée d’offrir un droit à l’oubli efficient et opérationnel aux citoyens européens.
La CNIL recommande aux détenteurs de données numériques d'adopter une politique d'archivage différenciée selon la nature des données conservées, afin de concilier les besoins d'exploitation des données avec le respect de la vie privée et le « droit à l'oubli » instauré par la loi informatique et libertés. La CNIL reprend pour ce faire les trois catégories d'archives définies par le code du patrimoine :
les archives courantes, désignant des données d’utilisation courante par les services concernés, par exemple les données relatives à un client dans le cadre d'un contrat ;
les archives intermédiaires, qui présentent un intérêt administratif pour les services concernés : leur durée de conservation est fixée par les règles de prescription applicables ;
les archives définitives, qui ont un intérêt strictement historique, scientifique ou statistique : elles peuvent être conservées indéfiniment.
Les archives courantes et intermédiaires ne doivent être conservées que pendant la période nécessaire à leur traitement, durée précisée lors de la déclaration du fichier à la CNIL. Cela est vrai en particulier des données contenant des éléments d'identification des personnes (articles 6 et 24 de la loi du 6 janvier 1978 modifiée en août 2004). Le gestionnaire de ces données doit donc prévoir la destruction à terme de ces archives.
Les archives intermédiaires ont vocation à n'être utilisées que par certains services, par exemple par le service du contentieux. Une gestion de la sécurité d'accès doit assurer que seules des personnes autorisées ont accès à ces données.
L'archivage de courriers électroniques ou mails
L’archivage des courriers électroniques répond à différents besoins émanant tant des directions informatiques, interlocuteur clé dans la majeure partie des projets actuels, mais également des directions métiers. Cela dépend généralement de la taille des entreprises et de leur organisation (par exemple, en mode projet).
Trois formes d’archivage pour les courriers électroniques sont mises en avant par plus d’une organisation sur deux. L’archivage le plus couramment constaté dans les organisations aujourd’hui peut être qualifié d’archivage « économique » et répond à des problématiques de gestion et de réduction des coûts induits par l’augmentation incessante des courriers électroniques qui génère des coûts de stockage importants et un engorgement des messageries, à des enjeux de recherche des courriers électroniques, de gains de productivité. De tels projets d’archivage sont souvent à l’initiative des directions informatiques et peuvent par la suite donner lieu à des projets d’archivage différents de la part d’autres directions au sein de l’organisation. Les deux autres formes d’archivage, davantage envisagées par les organisations que réellement déployées en ce début 2009, s’assimilent à l’archivage « réglementaire » et l’archivage « probatoire ». Assez proches l’une de l’autre, elles se différencient néanmoins par le caractère contraint de la première : l’existence d’un certain nombre de lois et de réglementations (telles que SOX, Bâle 2, etc.) oblige certaines entreprises à conserver des courriers électroniques et pièces jointes précisément identifiés (factures, fiches de paie, etc.) en cas de contrôle externe. Les directions métiers concernées (DAF, DRH, vente, etc.) sont de plus en plus demandeuses d’un tel archivage. Dans le cas de l’archivage qualifié de « probatoire », l’organisation se place davantage dans une position préventive et souhaite mettre en place les outils (logiciels, sous-traitances) lui permettant en cas de litige de pouvoir identifier les pièces (factures, contrats, relevés bancaires, brevets, etc) pour les dossiers et de pouvoir les utiliser à titre de preuve. De tels projets d’archivage sont le plus souvent entre les mains des directions juridiques.
En 2012, 59% des décideurs jugent nécessaire l’archivage « probatoire ».
Les études montrent que le numérique prend une place et une influence de plus en plus importante. Il devient nécessaire d’adapter les structures afin d’archiver tous types de documents. Ces derniers doivent répondre à des exigences légales et règlementaires ou doivent pouvoir être opposables en cas de litiges.
Cependant, la notion de risque et l’absence de preuves apparaissent, dues aux pertes de données et au non-respect des règles de conservation. De tels événements peuvent avoir de lourdes conséquences en cas de contrôle fiscal, de procès, de pertes de données stratégiques, etc. L’enjeu est donc le coût du risque, même s’il ne semble pas évident à déterminer selon les décideurs. En 2010, 35 % des organisations françaises interrogées déclaraient pratiquer l’archivage de contenus à valeur probatoire. Elles devraient être 71 % d'ici à l'horizon 2012.
Le 3 septembre 2013, l'équipe projet du programme VITAM (Valeurs Immatérielles Transmises aux Archives pour Mémoire) a publié une « preuve de concept » (POC) sur l'archivage des messageries, dans le cadre de la préparation d’un dossier de présentation du programme destiné à la Direction interministérielle des systèmes d’information et de communication (DISIC).
Coût de l’archivage électronique
Il est difficile d’estimer le coût réel de l’archivage électronique. Celui-ci varie en fonction de la solution choisie. En effet, il ne sera pas le même en cas d’archivage externe ou interne et il comprend différentes catégories de coût.
Le processus d’archivage peut être mis en œuvre en interne. Ceci nécessite que soit adoptée une politique « connue et respectée par les personnes intervenant à un titre ou à un autre dans le processus de conservation » et formalisée pour respecter différentes contraintes (durée de conservation, modalités d’archivage électronique, ajout de métadonnées, etc). Par exemple, l’adoption d’une charte au sein de l’entreprise.
Cependant, son coût pour l’organisme peut être très important (formations, matériels informatiques, logiciels, temps d’archivage, mise à jour des normes, etc). Ainsi beaucoup d’entreprises se sont spécialisées dans l’archivage et offrent une large gamme de solutions.
Toutefois, il faut s’assurer de prendre certaines précautions dans la rédaction du contrat de service qui sera conclu par l’entreprise, notamment en termes :
de confidentialité et de sécurisation des informations qui sont confiées au prestataire,
d’obligation d’information et de conseil mise à sa charge,
d’assurance professionnelle,
de bien définir l'indexation et les plans de classement qui seront mis en place,
de la possibilité d'un traitement de reconnaissance de caractère (OCR) pouvant permettre la recherche par mots-clés,
ou encore de prévision des conditions de reprise de sa mission de conservation par un tiers.
Le recours à un prestataire externe peut permettre de prévoir contractuellement les évolutions technologiques nécessaires et de garantir la sécurité des données.
Les offres communes sont des abonnements à des coffres forts numériques, des licences utilisateurs pour un type de service particulier, ou encore la location d’un volume de données comme proposé par le CINES ou la BNF. Leurs coûts varient de plusieurs centaines à milliers d’euros par an.