La technologie d’extraction de données d’A2iA permet de localiser et de reconnaître toutes les informations identifiantes des documents imprimés et manuscrits, de définir les informations clés de l'expéditeur ou du destinataire qu’elles soient numériques, alphanumériques (numéro de sécurité sociale, numéro de téléphone, référence client, compte ...) ou alpha (nom, prénom, bloc d'adresse...). 

L’extraction de données va plus loin que la simple reconnaissance de champs à position fixe. A partir de l’image complète d’un document – un courrier par exemple – la technologie A2iA est capable de localiser les informations identifiantes quelques soient leurs positions dans le dit-document. S’appuyant sur des expressions régulières prédéfinies – telles qu’un format de numéro de téléphone mobile – la technologie A2iA localise, extrait et reconnaît ces informations pour les transmettre au workflow de gestion documentaire.

A2iA utilise 4 méthodes pour réaliser l’extraction de données : 

  • Extraction sur documents prédéfinis. Certains documents tels que les chèques, les RIB ou les enveloppes, sont préconfigurés dans les solutions A2iA. (structure, format, localisation des données à extraire).  
  • Extraction sur documents structurés. A2iA reconnaît et extrait des données dont la localisation est fixe.  
  • Extraction sur documents semi-structurés. La disposition du document varie mais les données à extraire restent inchangées. A2iA les localise à partir de leur format et de la proximité de mots clés, n’importe où sur le document. 
  • Extraction sur documents faiblement ou non-structurés. Le format et le type de contenus ne sont pas connus à l’avance. Dans ce cas, A2iA extrait les informations identifiantes du document (mots-clés flottants) en s’appuyant sur des expressions régulières.

Les données extraites peuvent ensuite être importées dans la GED de l’entreprise. Grâce à cette solution, les informations manuscrites et imprimées sont intégrables dans les bases de données structurées, et consultables aussi facilement que les données numériques.