Acquisition et numérisation

Parmi les principales fonctions d'un gestion documentaire, l'acquisition ou numérisation constitue évidemment la première étape.

Principe de la numérisation

Dans son sens le plus général, la numérisation est la transformation d'un élément réel en une suite de nombres permettant de le traiter informatiquement. 
Dans un cadre d'entreprise, la numérisation est souvent entendue comme la transformation d'un document papier (texte ou image) en document électronique.

L'acquisition peut s'effectuer par :

  • L'intégration de documents papiers existants : c'est, pour les documents papiers, la numérisation grâce à des scanners. Lorsque c'est possible et utile, les documents numérisés peuvent alors être triés via une technologie de RAD (Reconnaissance Automatique de Documents). Il est possible d'extraire des informations des images numérisées en mettant en œuvre une technologie de LAD (Lecture Automatique de Documents). Cette technologie peut utiliser des techniques d'OCR (Reconnaissance Optique de Caractères), de reconnaissance de codes à barres et d' ICR (Reconnaissance Intelligente de Caractères) comportant par exemple des règles de vérifications linguistiques sur les mots reconnus.

            Les documents papiers peuvent ensuite être détruits (soit parce qu'ils n'ont pas d'intérêt, soit parce que la valeur probante des copies électroniques est certaine) ou archivées. Attention cependant, pour ce qui est des archives publiques, la copie électronique de document n'autorise pas obligatoirement sa destruction…

  • L'intégration de documents électroniques existants : une autre famille de documents est constituée des documents électroniques comme les fichiers bureautiques, les fichiers PDF… Enfin, la dernière famille de documents intégrable est constituée des documents COLD (Computer Output To Laser Disc)  qui proviennent de systèmes d'éditique.
  • La production de documents électroniques : elle peut être le résultat d'une ou de plusieurs procédures gérées par différents agents de l'entreprise grâce à un logiciel d'informatique de groupe (groupware ou collecticiel). Le document peut aussi être obtenu par un logiciel d'informatique décisionnelle à partir d'un modèle disponible via l'outil.
  • L'échange de documents électroniques : il s'effectue lorsque deux organismes partenaires souhaitent partager des documents électroniques. Ils peuvent alors procéder à une interconnexion de leurs systèmes d'information par un dispositif d'EDI (Échange de Données Informatisé) moyennant le respect d'un même format de données normalisé.

Quel que soit le moyen par lequel le document intègre le système de gestion, il peut souvent passer par une chaîne de validation ou workflow afin d'aboutir à une version finale approuvée par les utilisateurs concernés. Le workflow lié à la validation d'un document est paramétrable et prend en compte les droits d'accès et les profils des utilisateurs du système ; il agit le plus souvent sur le statut, la version et la visibilité du document.

Objectifs de la numérisation

La numérisation ne peut pas être la copie exacte du document physique d'origine. Certaines des caractéristiques de ce document sont nécessairement perdues. 
Il faut plutôt considérer la numérisation comme l'extraction de la substantifique moelle d'un document. L'objectif final est de faciliter le traitement du contenu :
  • reconnaissance,
  • copie,
  • stockage,
  • indexation,
  • recherche.

Types d'éléments et procédés

Il est possible de numériser à peu près tous les éléments du monde réel, avec plus ou moins de précision et de possibilités de rematérialisation :
  • les textes et images peuvent être numérisés grâce à un scanner ou un appareil photo numérique,
  • les sons et vidéos peuvent être enregistrés à l'aide du matériel et des logiciels d'acquisition adéquats,
  • il existe même des scanners 3D qui permettent d'obtenir un modèle 3D d'un objet physique.

Formats d'enregistrement

Une fois numérisées, les données doivent être stockées pour pouvoir être utilisées. Les approches suivantes peuvent être considérées :

  • Le stockage des données numérisées brutes : cela permet de différer leur traitement, mais peut demander énormément d'espace de stockage. On privilégie ici les formats d'enregistrement sans perte (TIFF, WAV…),
  • le stockage des données traitées : on stocke par exemple le document PDF obtenu après traitement par reconnaissance de caractères. Si on souhaite effectuer d'autres traitements, il peut être nécessaire de renumériser l'élément physique,
  • le stockage de données numérisées compressées : on considère qu'une faible perte de données est acceptable pour économiser l'espace de stockage (formats JPEG, MP3…). 
    Quels que soient les fichiers considérés, il est recommandé d'opter pour des formats ouverts afin d'en assurer la pérennité.

Récupération des informations

Les données numérisées ne sont souvent pas exploitables telles quelles. 
Les documents texte sont souvent traités par un logiciel de reconnaissance de caractères. 
On peut également utiliser de la reconnaissance d'images. Certains logiciels de gestion de photographies permettent par exemple d'identifier les personnes présentes sur les photos avant leur stockage dans une banque d'images. 
Les sons peuvent passer par une étape de reconnaissance vocale.

Matériel nécessaire

Le matériel de numérisation est disponible dans toutes les gammes. Ainsi, les scanners vont du scanner à plat classique pour 50 € à des scanners ultra-rapides ou grand format dont le prix peut atteindre plusieurs milliers d'euros. 
Les besoins de l'organisation doivent donc être clairement définis pour dimensionner au mieux les investissements. 
Il faut parfois ajouter au matériel de numérisation pure, les logiciels de traitement des données numérisées.

Externalisation de la numérisation

La numérisation utilise du matériel et des logiciels coûteux. Elle nécessite aussi des procédures de vérification des documents numérisés. Les entreprises de taille réduite qui n'ont pas les ressources ou les moyens d'investir dans une solution de numérisation en interne peuvent préférer l'externalisation. 
Même si l'entreprise choisit d'opérer en interne, l'externalisation de la numérisation peut être intéressante lors de la mise en place d'une GED. Un prestataire dédié peut reprendre toutes les archives et les intégrer au système.


ged-fonctions
598