Extraction de données
La technologie d’extraction de données de Mitek permet de localiser et de reconnaître toutes les informations identifiantes des documents imprimés et manuscrits, de définir les informations clés de l'expéditeur ou du destinataire qu’elles soient numériques, alphanumériques (numéro de sécurité sociale, numéro de téléphone, référence client, compte ...) ou alpha (nom, prénom, bloc d'adresse...).
L’extraction de données va plus loin que la simple reconnaissance de champs à position fixe. A partir de l’image complète d’un document – un courrier par exemple – la technologie Mitek est capable de localiser les informations identifiantes quelques soient leurs positions dans le dit-document. S’appuyant sur des expressions régulières prédéfinies – telles qu’un format de numéro de téléphone mobile – la technologie Mitek localise, extrait et reconnaît ces informations pour les transmettre au workflow de gestion documentaire.
Mitek utilise 4 méthodes pour réaliser l’extraction de données :
- Extraction sur documents prédéfinis. Certains documents tels que les chèques, les RIB ou les enveloppes, sont préconfigurés dans les solutions Mitek. (structure, format, localisation des données à extraire).
- Extraction sur documents structurés. Mitek reconnaît et extrait des données dont la localisation est fixe.
- Extraction sur documents semi-structurés. La disposition du document varie mais les données à extraire restent inchangées. Mitek les localise à partir de leur format et de la proximité de mots clés, n’importe où sur le document.
- Extraction sur documents faiblement ou non-structurés. Le format et le type de contenus ne sont pas connus à l’avance. Dans ce cas, Mitek extrait les informations identifiantes du document (mots-clés flottants) en s’appuyant sur des expressions régulières.
Les données extraites peuvent ensuite être importées dans la GED de l’entreprise. Grâce à cette solution, les informations manuscrites et imprimées sont intégrables dans les bases de données structurées, et consultables aussi facilement que les données numériques.