Le principe d’une technologie OCR est de lire le document pour détecter les formes, puis les comparer à des bibliothèques de formes pour en faire correspondre un caractère. Si des erreurs surviennent lors de la reconnaissance d’un caractère, l’OCR compare alors le mot entier au contenu de son dictionnaire intégré pour en déduire l’équivalence la plus proche et ainsi corriger le caractère mal lu. Ainsi le texte pourra alors être segmenté selon l’information recherchée. La technologie de reconnaissance optique de caractères (OCR) est la clé permettant d'accéder aux informations papier imprimées et de les intégrer à un workflow de gestion documentaire.

Les moteurs OCR développés par A2iA sont intégrés de façon transparente aux autres moteurs ICR (Intelligent Character Recognition) et IWR (Intelligent Word Recognition) également développés par l’éditeur français. Ainsi la puissante solution de «triple reconnaissance» d’A2iA propose la suite logicielle de reconnaissance la plus complète et précise sur le marché.