LAD / Conversion / Indexation
Papier et PDF vers XML
  • Une série d'outils pour la LAD et pour la conversion de fonds documentaires hétérogènes et de documents non structurés. .
  • Combinaison et croisement d'algorithmes textuels, typographiques et topologiques.
Caractéristiques
  • Conçu pour traiter des fonds hétérogènes : Revues, livres, bulletins, dictionnaires etc; et pour optimiser la lecture et l'extraction de grands volumes.
  • Moteur de règles indépendant (basé XML) avec ses outils de développement et de test.
  • Modules configurables dans un WorkFlow permettant un traitement automatique et paramétrable avec
    des alertes, des contrôles et du reporting.
Avantages
  • Richesse des options dans la construction des règles permettant une très grande flexibilité pour traiter des besoins complexes.
  • Formats standardisés - XML, ALTO - à toutes les étapes de la chaîne.
  • Workflow et modules de traitement évolutifs grâce à une interface d'extension pour AddIns et PlugIns.
  • Possibilité de contrôle manuel sélectif basé sur des alertes automatiques.
  • Pour les PDF/texte : extraction avancée du contenu PDF.
e-PUBLICATION
DCS
EXTRACTION PDF
WORKFLOW
A LA VOLÉE
eP XML PLATEFORME
EN LIGNE