OCR & HTR

OCR : Reconnaissance optique de caractères imprimés
HTR : Reconnaissance optique de texte manuscrit

Voici quelques exemples de technologies mises en place par ISAKO dans ce domaine :

Optimisations Pré-OCR

Dans certains cas, la lisibilité post-scan d’un document est pénalisée par un artefact visuel venant du document d’origine. Par exemple, quand le texte est imprimé sur un fond colorié ou sur un fond tramé.
La technologie d’ISAKO opère en amont de l’OCR de façon à minimiser le biais négatif (bruit parasitaire) que ces profils visuels exercent sur les algorithmes du moteur OCR. Il s’agit en quelque sorte d’effacer le fond sans toucher au texte.

Améliorations Post-OCR

Il s’agit d’améliorer l’exactitude du résultat du moteur OCR. Même les meilleurs d’entre eux ne suffisent pas pour donner un texte de qualité dite « éditoriale ». Par la nature même des technologies multi-fonts et la dépendance de la langue du contenu, il n’est pas possible d’atteindre la très haute qualité attendue dans l’édition.  
Les technologies d’ISAKO sont basées sur un ensemble algorithmique organisé en entonnoir comportant un clustering visuel avancé, analyses statistiques et élimination des hypothèses. De plus, cette solution ne dépend pas d’une langue particulière.

Reconnaissance du contenu manuscrit

Il s’agit de la reconnaissance des valeurs manuscrites au sein des formulaires. La technologie d’ISAKO consiste en une association de plusieurs technologies permettant d’isoler les zones contenant les informations manuscrites, les extraire et en reconnaitre la valeur.