Pour savoir où on va, il faut savoir d'où l'on vient

Vous avez
une question ?
Un projet ?

Contactez nous !
 

Contactez-nous

Vous avez une question ? un projet ? 
Vous souhaitez plus d'informations sur un produit ? sur notre offre ? 
Contactez-nous, on vous répond sous 4H.

eZHumanCAPTCHACode reload
retour

Numérisation

Numérisation

Les applications de gestion documentaire ne prennent, en général, pas en charge la numérisation, ni les traitements associés – ceux-ci sont couverts par des solutions dédiées. Elles traitent les phases initiales depuis la conversion du support, jusqu'à « l'injection » du document dans la GED. L'application documentaire reprend la main sur les traitements métiers, notamment d'indexation, une fois le fichier « injecté ».

Les fonctions évoquées ci-dessous entrent dans le spectre de la gestion documentaire, mais ne sont en général pas prises en compte directement par les solutions de GED.

Pilotage de scanner et préindexation

Dans une chaîne de dématérialisation, il s’agit de la première fonction à prendre en compte.

C'est le plus souvent via une application installée sur le poste connecté au scanner qu'est réalisée la numérisation, mais cela peut également être mis en œuvre via une interface Web.

L'objectif étant de faciliter au maximum le processus qui comprend la numérisation et la saisie des premières métadonnées du document (on parle de préindexation), on s’efforce d’optimiser l’interface proposée à l’opérateur pour numériser et préindexer les documents dans la GED.

 

En effet, c’est là que sont saisies les métadonnées explicites (date de numérisation, expéditeur, destinataire, montant d’une facture...). Leur exactitude et leur complétude vont déterminer une part importante l'efficacité des traitements ultérieurs et donc de la valeur ajoutée du système.

Des procédés de gestion de lots et l’introduction de reconnaissance automatique permettent d’améliorer ces processus.

Reconnaissance automatique
On trouve plusieurs catégories d’outils de reconnaissance automatique. Leur finalité est toujours de retranscrire l’information issue du support physique (papier) en son équivalent électronique, en minimisant les pertes, les erreurs et les interventions humaines.

Ces outils sont largement dépendants de la qualité de la numérisation : inclinaison, définition, visibilité de la trame du papier… Ces considérations doivent donc être prises en compte d’autant plus précisément qu’une reconnaissance automatique est prévue.

Les acronymes du domaine de la reconnaissance automatique :

  • caractères. OCR : Optical Character Recognition ou reconnaissance optique de caractères.

Les « bons OCR » atteignent des taux de reconnaissance du document numériser de plus de 95% et savent remettre en forme des tableaux, reconnaître les styles, etc…

  • ICR : Intelligent Character Recognition ou reconnaissance intelligente de caractères.

Dédié à la reconnaissance de l’écriture cursive (manuscrite), ce type d’application est notamment très utilisé par les banques pour les chèques.

  • LAD : Lecture Automatique de Document.

Pour l’acquisition de données structurées dans une base de données par rapport à des champs préalablement identifiés.

  • RAD : Reconnaissance Automatique de Document.

L’objectif est d’orienter les documents vers le bon processus de reconnaissance (plus haut). Ceci permet notamment d’appliquer des règles particulières en fonction du type de document reconnu.

Basés sur des algorithmes complexes ces outils sont largement dépendants de la qualité de la reconnaissance et de l’utilisation de dictionnaires linguistiques et métiers. Les meilleurs utilisent des notions d’apprentissage et de suggestion de reconnaissance par association.

L’intégration de ces fonctions dans une GED consiste le plus souvent en l’adjonction d’une application dédiée et la conception d’un « injecteur » (ou connecteur) pour récupérer dans la GED le résultat des flux numérisés.

Notons qu’il n’existe pas de solution réellement satisfaisante de reconnaissance automatique en open source.