|
|
LAD / Conversion / Indexation |
|
|
|
|
|
|
|
Papier et PDF vers XML |
|
|
|
|
|
|
|
|
|
|
- Une série d'outils pour la LAD et pour la conversion de fonds documentaires hétérogènes et de
documents non structurés.
.
- Combinaison et croisement d'algorithmes textuels, typographiques et topologiques.
|
|
|
Caractéristiques |
|
|
|
|
|
|
|
|
|
|
- Conçu pour traiter des fonds hétérogènes : Revues, livres, bulletins, dictionnaires etc; et pour optimiser la lecture et l'extraction de grands volumes.
- Moteur de règles indépendant (basé XML) avec ses outils de développement et de test.
- Modules configurables dans un WorkFlow permettant un traitement automatique et paramétrable avec
des alertes, des contrôles et du reporting.
|
|
|
Avantages |
|
|
|
|
|
|
|
|
|
|
- Richesse des options dans la construction des règles permettant une très grande flexibilité pour traiter des besoins complexes.
- Formats standardisés - XML, ALTO - à toutes les étapes de la chaîne.
- Workflow et modules de traitement évolutifs grâce à une interface d'extension pour AddIns et PlugIns.
- Possibilité de contrôle manuel sélectif basé sur des alertes automatiques.
- Pour les PDF/texte : extraction avancée du contenu PDF.
|
|
|
|