Carnet de route Rétroconversion Cognac – Etape 3 – On océrise, on saisit et on dérive !

Après un test de démarrage et une phase de tri, la saisie des fiches et registres débute pour les fonds de la Médiathèque de Cognac.

Cognac/Angers, le 16 mai 2023 01:30 PM.  Pour le chantier de rétroconversion et rétro catalogage de la Médiathèque de Cognac,  AureXus procède maintenant à l’océrisation des documents numérisés ou leur saisie, qui seront suivis des tentatives de dérivation et enfin la création des notices.

Après l’étape de numérisation dans l’atelier d’AureXus, les fiches et registres de la Médiathèque de Cognac sont océrisés ou saisis et les données réunies sont préparées pour la dérivation.


Saisie des fiches et registres

La méthode d’AureXus pour la rétroconversion convient très bien à des fichiers très hétérogènes comme ceux de la Médiathèque de Cognac.  Il y a en effet des fiches manuscrites et dactylographiées et des registres manuscrits, chacun doit être traité différemment.

  • Pour les registres manuscrits, il est procédé à une double saisie à l’identique par deux opérateurs différents. Une comparaison automatique est ensuite mise en place, un travail qui nécessite une grande rigueur.
  • Pour les fiches dactylographiées, c’est un peu plus simple, un traitement OCR est appliqué suivi d’une vérification manuelle et correction éventuelle des caractères erronés. Les mentions non-océrisables (comme les mentions d’appartenance manuscrites) sont saisies manuellement.
  • Dans le cas des fiches manuscrites, les choses sont un peu plus complexes. Plusieurs traitements différents sont appliqués pour chaque type de fiches :
    • Fiches simples : double saisie manuelle à l’identique, comme pour les registres manuscrits.
    • Fiches multi notices (Une fiche génère plusieurs notices) : double saisie et reconstitution des notices.
    • Fiches incomplètes : rapprochement avec les notices de registres, par le titre et l’auteur dans le cas de notices du registre non cotées.

Ainsi, si une notice de registre correspond à une notice de fiche, elle est traitée. A l’inverse, si aucune correspondance ne peut être faite entre la notice registre et une des notices des fiches, la notice n’est pas traitée et elle est exclue du fichier final.

Fig 1. Exemple de fiche manuscrite incomplète numérisée

AureXus réalise ensuite un pré-formatage sur les fichiers pour les préparer à la dérivation.

Avant cette étape de dérivation, certains fichiers font l’objet d’un traitement spécifique de consolidation des différentes sources effectué par les outils MEDUSA d’AureXus, tel que :

  • Les informations complémentaires des différentes sources -fiches et registres- sont consolidées pour créer une notice fusionnée plus riche, composée des éléments complémentaires que l’on peut glaner dans les différentes versions lacunaires de la notice.
  • Les rapprochements des différentes descriptions de la même notice se font par cote ou titre et auteur quand l’une des versions n’a pas de cote.
Fig 2. Exemple de registre manuscrit très artistique du fonds 1 de la Médiathèque de Cognac avec page titre par thème

Débroussaillage dans les fiches saisies

Une fois l’étape de saisie terminée, et dans une optique d’efficacité de la suite du traitement un désherbage est effectué dans cet ensemble pléthorique de fiches. Cette tâche qui consiste à enlever tous les doublons a été un véritable nettoyage pour ce chantier !

Grâce à ses outils logiciels de traitement, AureXus a pu présenter à la Médiathèque des listes de doublons et de fiches ou notices à éliminer.  Les équipes de la Médiathèque ont pu ainsi facilement épurer le fichier en confirmant les enregistrements à supprimer.

Fig 3. Exemple de doublons compliqués à identifier

Dérivation de Notices

Après chargement des fichiers numériques dans la base de données de la plateforme collaborative MEDUSA, les robots de dérivation prennent le relais !

Des tentatives de dérivation sont exécutées à partir du réservoir de la BnF, puis du SUDOC dans un second temps.
Une liste de demande de vérifications est accessible sur MEDUSA et une liste de requêtes est envoyée par fichier xls, en cas d’anomalie spécifique due à des fiches lacunaires.

Fig 4. Diagramme de flux (“Deriv.”=Dérivation, “Rech. auto”=Recherche automatique, “Rech. manuelle” = Recherche manuelle)

Pour ce chantier de Cognac, des règles particulières ont dû être appliquées.

  • Les fiches manuscrites étant lacunaires pour les fonds Albert et “Magasins” et sont presque toutes dépourvues de mention d’éditeur. C’est pourquoi, quel que soit l’éditeur sur la dérivation, si toutes les autres informations correspondent, la dérivation sera maintenue.
  • Si pour un même ouvrage, plusieurs notices présentent un éditeur différent mais avec une même année, une anomalie DER (éditeurs) est signalée et une recherche en magasin est effectuée afin de traiter cette anomalie. Au lieu d’être dirigé vers l’étape de création, une recherche en magasin est effectuée pour confirmer la dérivée.

Les notices qui n’ont pas pu être dérivées entrent quant à elles dans une phase de création. A suivre lors de la prochaine étape !


AureXus
AureXus est une société française de plus de 10 ans d’expérience, spécialisée dans la dématérialisation et le traitement de données pour les Bibliothèques, les Archives, les Musées et les entreprises à travers le monde. Les équipes d’AureXus sont expertes en création, conversion, enrichissement et valorisation de contenus multilingues et multi caractères. AureXus offre de nombreux services numériques de création ou conversion de contenu, tels que la numérisation 2D et 3D, l’aide à la transition numérique, la réalisation de visites virtuelles, l’océrisation, l’ALTO, l’indexation, la rétroconversion, le catalogage et l’encodage en XML-EAD, INTERMARC, UNIMARC, l’enrichissement de données par liens vers le Web de données, ainsi que des services de création de contenu elearning pour la formation à distance.

Une goutte d’eau dans l’océan ! Avec son programme Bleu.AureXus, la société s’engage au quotidien pour la préservation de l’environnement et particulièrement des océans.

Contact
info-a-aurexus-com
(+33) 09 70 40 70 12
www.aurexus.com

Laisser un commentaire

%d blogueurs aiment cette page :