PEPO® (Publication Électronique en Page Originale) / OFEP® (Original Format Electronic Publication)
 

Technologie permettant de visualiser le contenu sous sa forme originale (pages scannées) avec la mise en évidence des occurrences recherchées.

Types de clients : Entreprises, Intégrateurs, Institutions, Editeurs.

Formats standards utilisés :

  • Formats d’entrée :
    TIFF/JPG après numérisation (scan) ou bien Postscript ou PDF, s'il est déjà disponible sans passer par la numérisation. De nombreux autres formats d'images sont possibles.
  • Formats d'indexation :
    XML ou bien répartition en deux : le texte intégral d'un coté, et des éléments de la structure indexés parallèlement de l'autre.
  • Formats d'affichage :
    TIFF/JPG sur CD/DVD ou PDF/GIF/PNG/JPG sur Internet. D'autres formats d'images sont également possibles.
    Utiliser le PDF en entrée représente un intérêt tout particulier, car les éditeurs ont souvent une version PDF de leurs ouvrages depuis plusieurs années. Ainsi, il est possible de réaliser une publication électronique performante et conviviale sans changer ni alourdir les procédures éditoriales existantes.

L’interactivité numérique ajoutée aux ouvrages papier, fonctionnalité innovante et exclusive de cette technologie :

  • Consultables à l'écran ou sur papier après impression, les documents sont visualisables sous leur forme originale exacte. C'est une lecture aisée et parfaite qui associe les éléments graphiques au texte tout en gardant le bénéfice des mises en pages attractives réalisées par l’éditeur.
  • Le contenu original est consultable via une interface conviviale dans toute sa richesse, y compris les formules mathématiques, les tableaux, les diagrammes, les illustrations et éléments graphiques...
  • Après une recherche, les occurrences trouvées apparaissent en surbrillance dans le texte sous sa forme originale.

Les avantages pour le lecteur :

  • Le lecteur se retrouve dans un univers familier, convivial et intuitif.
  • Les modes d'accès courants lui sont disponibles : la navigation classique, comparable à l'orientation dans l'ouvrage imprimé, - par la table des matières et par le numéro de page,- est agrémentée par la rapidité du support électronique.
  • L'accès aux documents à travers différents angles de recherche permet de découvrir le fonds sous de nouvelles dimensions.
  • Il dispose de l'exhaustivité et de l'efficacité de modalités d'accès exclusivement électroniques :
    • la recherche par titre ou par auteur,
    • l’accès par des index thématiques et alphabétiques,
    • la recherche en texte intégral où chaque mot peut être identifié et marqué.
    • En croisant les modalités ci-dessus avec une période de parution. C'est-à-dire en limitant la recherche à une plage de dates de parution.
  • Le lecteur appréhende plus rapidement les informations recherchées grâce à l’affichage et à l'impression d’une présentation familière.
  • La conservation à l'identique des pages originales d’un fond ancien permet au lecteur de retrouver les traces du contexte historique et de ressentir le plaisir particulier du « livre ancien ».

Les avantages pour l’éditeur :

  • La gestion fine des unités documentaires.
  • La préparation des données se fait en une seule fois et l’outil est utilisable sur tous supports électroniques, Internet, CD/DVD, etc.
  • L’outil peut servir à la publication électronique continue d’une revue sans modifier ni alourdir le travail éditorial de la rédaction.
  • Les formats d'entrée, d'indexation et d'affichage sont des formats standards connus et largement répandus.
  • Il facilite la protection du contenu présenté en mode image.
  • Solution rodée et fiable, elle ne nécessite pas d’effort éditorial et permet une économie substantielle en évitant le coût de saisie manuelle.

Principes de fonctionnement :

Un traitement automatique d'analyse d'images et de reconnaissance automatique de caractères (OCR) effectue la lecture des pages originales et reconstitue le contenu textuel.

  • La richesse du document XML qui résulte du traitement automatique permet d'effectuer des recherches avancées, y compris des requêtes multi-critères. Ce document XML est adaptable aux besoins, ce qui est particulièrement utile dans un contexte de sources hétérogènes.
  • Optionnellement :
    • La lecture automatique est précédée par un réglage spécifique à la mise en page du fond traité. Ce réglage, effectué une fois, est utilisé pour tous les documents ayant la même mise en page.
    • Les éléments de la structure (titres, chapitres, entêtes etc...) sont intégrés au corps du texte au sein du document XML. Ces éléments sont reconnus automatiquement d'après leurs attributs typographiques (par exemple : la taille de la police de caractères). Le balisage reflète le découpage de l'ouvrage en unités documentaires.
  • La totalité du contenu textuel peut servir à une recherche : chaque mot peut être identifié et marqué.
  • Les unités documentaires étant parfaitement délimitées, la recherche prend en compte la vraie structure logique du contenu.
  • Le support peut être un CD/DVD ou/et Internet. L'un ne conditionne pas l'autre. Il est important de noter qu'une partie importante du travail - la préparation des données - est commune.

Service optionnel :

Indépendant du moteur de recherche, ce module est intégrable dans des plate-formes de publication existantes (XPP® ou autre) ou peut enrichir des applications Métier (gestion de CV, gestion de contrat, etc.)

ICS®
DCS®
NCS®
ISA-TOOLS®
BCS®
IsakoStudio®
XPP®