Recommend Print

4. Aperçu des problèmes rencontrés dans la chaîne de traitement

  • Dernière Modification
    jeudi 27 septembre 2012

4.1 le périmètre de KBART

L'objectif du lien OpenURL est de donner aux utilisateurs qui en ont la permission un accès aux ressources. Des problèmes simples peuvent nuire au bon fonctionnement de cette technologie :

  • Manque d'adoption de la technologie OpenURL de la part de certains fournisseurs
  • Mauvaise qualité des métadonnées contenues dans les bases de connaissances
  • Mise en oeuvre incorrecte de la syntaxe OpenURL dans les liens OpenURL sources
  • Mauvaise syntaxe des liens entrants dans les liens OpenURL cibles

Le champ de compétence de KBART comprend l’évaluation des problèmes qui résultent ou se rapportent aux données fournies aux bases de connaissances (cf. les deux premiers points de la liste ci-dessus). Le présent document ne tient pas compte des problèmes qui résultent ou se rapportent à la mise à jour de la documentation de la norme OpenURL, car cette norme se trouve sous la responsabilité de l’organisme en charge de la maintenance de la norme OpenURL, actuellement l’OCLC[note1].

L’OCLC anime la communauté OpenURL au moyen d'une liste de diffusion[note2] qui favorise la discussion et sert de forum dans lequel la communauté peut soumettre les problèmes rencontrés. Les détails de l’annuaire pour le framework OpenURL sont disponibles sur http://alcme.oclc.org/openurl/servlet/OAIHandler?verb=Identify.

Toutefois, parallèlement aux recommandations du présent document qui concernent le transfert des métadonnées, les fournisseurs de contenu devront également fournir des détails sur la syntaxe de leurs liens aux développeurs de bases de connaissances. Ainsi l'exactitude des liens vers du contenu au niveau des titres, des numéros de revues et des articles sera assurée et les utilisateurs finaux pourront effectivement accéder à un contenu pertinent.

Le groupe de travail a identifié les problèmes suivants, relatifs aux métadonnées de mauvaise qualité et concernant des cibles openURL, discutées plus tard dans la section 4.2, comme appartenant au périmètre d’intérêt de KBART :

  • 4.2.1 Les problèmes d’identifiants incohérents
  • 4.2.2 Les problèmes de titres incohérents
  • 4.2.3 Les couvertures temporelles incorrectes
  • 4.2.4 Les formats de dates incohérents
  • 4.2.5 Les problèmes de description de la couverture des contenus
  • 4.2.6 Les incohérences des périodes d’embargo
  • 4.2.7 Le format et l’échange des données
  • 4.2.8 Les données de contenus obsolètes
  • 4.2.9 Le manque de personnalisation 

4.2 Exemples de cas où les données sont inexactes

Dans ce chapitre, nous illustrons les modalités selon lesquelles les usagers sont directement touchés par une mauvaise gestion des données dans la chaîne de traitement de la base de connaissances. Nous tentons de fournir des solutions indicatives ; les recommandations complètes pour les bonnes pratiques sont données au chapitre 5, intitulé “Recommandations pour un échange efficace de métadonnées avec les bases de connaissances”.

4.2.1 Les problèmes d’identifiants incohérents

Le problème central : la réutilisation de l’ISSN (par exemple quand un périodique change de titre) ou de l’ISBN (par exemple parmi plusieurs titres d’un même éditeur) provoque la confusion du côté du résolveur de liens, étant donné qu’un identifiant supposé être unique ne l’est plus.

L’impact sur l’utilisateur : la syntaxe OpenURL utilise l’ISSN unique comme composant clé. Quand une référence bibliographique (i.e. une source) utilise un ISSN exact mais qu’une ressource en texte intégral (c’est-à-dire une cible) utilise un ISSN inexact —tel que celui d’un titre antérieur ou postérieur— le résolveur de liens sera incapable de résoudre l’incohérence et ne pourra pas renvoyer les bons liens vers le contenu cherché.

Les Solutions: L'utilisation précise de l'ISSN est indispensable pour assurer une bonne résolution des liens basés sur OpenURL. Le fournisseur de contenus doit veiller à ce que l'ISSN fourni dans le fichier qui alimente la base de connaissances est exact et concerne l'ouvrage décrit. Pour éviter la réutilisation inappropriée de l'ISSN lors de l'attribution d'ISSN aux œuvres nouvelles et changeantes, les éditeurs sont invités à consulter les bonnes pratiques de leurs centres ISSN nationaux[note3], ou celles de l'organisme ISSN international[note4].

KBART attend également des développeurs de bases de connaissances qu’ils soient prochainement capables de gérer avec succès les ISSN multiples pour un titre donné.En effet, la plupart des titres disponibles en version imprimée et en ligne se voient assigner plusieurs ISSN valides. Ce phénomène est courant et la base de connaissances d’un résolveur de liens doit être en mesure de gérer ce cas proprement.

4.2.2 Les problèmes de titres incohérents

Le problème central : Les variantes orthographiques de titres, notamment causées par des fautes de frappe, les variations du titre, ou l'utilisation des titres antérieurs ou postérieurs, aboutissent à des problèmes de correspondance.

L’impact sur l’utilisateur : La plupart des résolveurs doivent trouver un moyen de gérer les variations typographiques et la ponctuation, mais ne sont pas forcément en mesure de résoudre les abréviations (par exemple : "NEJM" pour le New England Journal of Medicine), les variations orthographiques régionales (par exemple : “labour” vs. “labor”), ou les nombres écrits comme des mots (par exemple : "1er" ou " premier "). Le résolveur de liens peut échouer à trouver le bon titre —ou même ne serait-ce qu’un titre— quand il tente de résoudre une requête OpenURL. Et l'utilisateur ne pourra pas atteindre le contenu qu'il recherche.

Les Solutions: Une bonne pratique consiste à ce que tous les systèmes utilisent une forme du titre qui apparaît comme un titre principal dans une source de catalogage standard, tels que le CONSER[note5], la base de données OCLC WorldCat, ou le registre ISSN. Si aucune de ces ressources ne contient d’entrée pour ce titre, ce dernier doit être reproduit tel qu'il apparaît sur ​​la couverture de l'édition papier. En outre, les bases de connaissances devraient bientôt être en mesure de gérer les variantes de titres au sein de leur système.

4.2.3 Les couvertures temporelles incorrectes

Le problème central : La présentation de dates inexactes par les fournisseurs de contenus, ou le défaut de mise-à-jour des dates dans la base de connaissances par les développeurs, renvoie des résultats inexacts ou des liens invalides dans le résolveur de liens.

L’impact sur l’utilisateur : Certains usagers peuvent se voir signifier que la ressource qu'ils cherchent n'est pas disponible alors qu’elle l’est (par exemple si le fichier n'a pas été mis à jour et ne contient pas les numéros les plus récents mis en ligne) ou qu'une ressource est disponible quand elle ne l’est pas (par exemple si le contenu a été retiré, mais qu’il figure encore dans la liste des collections). Dans le premier cas, les utilisations considérées comme valides diminueront, dans le second, les usagers finiront par se détourner de la ressource cherchée si chaque tentative d’y accéder se solde par un échec.

Les Solutions : Les fournisseurs de contenus fourniront en temps voulu des fichiers d’état de collections qui comportent des dates de couvertures ; les propriétaires d’un résolveur de liens s'assureront quant à eux qu'ils traitent ces fichiers correctement et rapidement.

4.2.4 Les formats de dates incohérents

Le problème central : Sans format standard, les dates de couverture peuvent être interprétées de manière incorrecte. Par exemple, “20080305” signifie-t-il 5 mars 2008 ou 3 mai 2008 ? L'existence de plusieurs dates pour un article (par exemple, la date de la mise en ligne et la date de la publication du numéro, lorsque celles-ci diffèrent) peut également empêcher la mise en relation entre une référence bibliographique et la base de connaissances.

L’impact sur l’utilisateur : Des informations inexactes concernant la date empêchent la base de connaissances d’associer la référence bibliographique de la source à une ressource cible, ce qui empêche à leur tour les utilisateurs finaux d'accéder aux ressources, causant déception et diminution de l’usage.

Les Solutions : Le fournisseur de contenu utilisera la syntaxe de dates décrite dans la version la plus récente de la norme ISO 8601:2004 (Data elements and interchange formats – Information interchange – Representation of dates and times) lors de l'interprétation et l'affichage des plages de dates.

 

4.2.5 Les problèmes de description de la couverture des contenus

Le problème central : Certains fournisseurs n’offrent pas l’intégralité de la version papier quand ils la publient en ligne. Il arrive aussi que les éditeurs ne fournissent qu’un contenu partiel aux agrégateurs. En conséquence, certains articles entiers manquent, même s’ils sont déclarés dans l’étendue des collections. Dans d'autres cas, le contenu agrégé à partir de plusieurs sources est représenté complètement au niveau du titre et comprend tout le texte, mais il lui manque tableaux, figures, notes, ou d’autres parties des articles.

L’impact sur l’utilisateur : Les utilisateurs ne parviennent pas à obtenir tout ou partie du contenu qu'ils s'attendent à trouver. Et dans le cas des articles incomplets, ils peuvent même ne pas se rendre compte qu'ils n'ont pas accès à la totalité du contenu proposé par le fournisseur de contenu original.

Les Solutions : Les fournisseurs de contenu déclareront le type de contenu offert. Un ensemble de termes pour décrire la couverture est fournie au chapitre 5.3.2.15.

4.2.6 Les problèmes de périodes d’embargo

Le problème central : Les développeurs de bases de connaissances se posent souvent des questions quant à la façon d'appliquer des conditions d’embargo changeantes. En effet, les mêmes termes peuvent être entendus différemment par chacun des fournisseurs de contenus.

L’impact sur l’utilisateur : La terminologie relative aux embargos est complexe. Un "embargo sur 1 an" peut par exemple signifier que les 12 derniers mois ne sont pas disponibles, ou bien que l'année civile en cours (ou précédente) n'est pas disponible (par exemple, de janvier d'une année donnée jusqu’à ce jour). Les utilisateurs ne savent donc pas avec certitude si l'article qu'ils cherchent se trouve dans une base de données lorsque la date d'émission tombe dans —ou près de— la période d'embargo.

Les Solutions : L’utilisation de la syntaxe sur les durées, suivant la norme ISO 8601, atténue ce problème puisqu’elle permet de décrire plusieurs types d'embargo. Voir le chapitre 5.3.2.14 pour plus de détails

4.2.7 Le format et l’échange des données

Le problème central : Les erreurs dans les données ou les échanges non-standardisés de données ralentissent leur versement dans la base de connaissances. Les données qui ne sont pas conformes aux  formats convenus sont également une source de liens invalides.

L’impact sur l’utilisateur : Des informations inexactes et périmées produisent des liens qui ne peuvent pas être résolus, et empêchent les utilisateurs d'atteindre des contenus auxquels ils devraient avoir accès.

Les Solutions : Les fournisseurs de contenus se conformeront aux recommandations de ce rapport et affecteront un membre de leur personnel qui veillera à la bonne marche vers la mise en conformité des données concernées. Les éditeurs de résolveurs de liens procureront aux fournisseurs de contenus l’accès à un compte d'essai afin qu'ils puissent vérifier les données sur leurs publications, telles que représentées dans la base de connaissances.

4.2.8 Les données de contenus obsolètes

Le problème central : Les données de contenus obsolètes mènent à une présentation incorrecte des données.

L’impact sur l’utilisateur : Les données présentes dans les bases de connaissances ne peuvent pas être plus précises que celles qu’on y a versées. Si certaines données “à jour” ne sont pas disponibles, les utilisateurs ne pourront pas accéder au contenu récent auquel ils ont pourtant droit.

Les Solutions : Les fournisseurs de contenus délivreront régulièrement des informations sur les collections, selon une fréquence qui suit leur calendrier de publication. Les fournisseurs de résolveurs de liens permettront aux utilisateurs des catalogues de bibliothèques de voir quand les données ont été fournies pour la dernière fois et quand elles seront de nouveau actualisées. Les fournisseurs de résolveurs de liens informeront les fournisseurs de contenus et les bibliothécaires de leur calendrier de mises-à-jour des bases de connaissances et confirmeront le moment exact de leur exécution.

4.2.9 Le manque de personnalisation

Le problème central : Plutôt que de se voir proposer uniquement les titres et couvertures accessibles à leur seul établissement, les clients ont généralement tous accès aux mêmes couvertures temporelles : les plus larges.

L’impact sur l’utilisateur : Les bibliothécaires se voient obligés de consacrer du temps à personnaliser ces listes afin qu’elles représentent fidèlement les fonds de l’établissement. Ils prennent alors le risque d’introduire des erreurs qui auront pour conséquence la rupture de l’accès ou de l’utilisation d’une ressource offerte par un fournisseur.

Les Solutions : Les fournisseurs de résolveurs de liens et de contenus travailleront ensemble pour échanger des fichiers spécifiques aux collections de chaque bibliothèque. Chaque établissement pourra ainsi mieux gérer les données qui lui sont relatives. Étant données l'importance et la complexité de la question de la personnalisation, KBART a l'intention de l'étudier plus avant au cours d'une phase ultérieure. Même si le fournisseur ne peut pas générer un fichier distinct pour chaque établissement, il peut toujours générer des fichiers spécifiques de collections pour les abonnements ou bouquets les plus courants.

News

  • Offre de stage de conservateur ezPAARSE - ENSSIB +

    Le SCD de l'Université de Valenciennes et du Hainaut-Cambrésis (UVHC) propose un stage de conservateur intitulée "Statistiques d’utilisation des ressources électroniques du SCD : récupération et exploitation de données locales" (du 2 février au 7 mai 2015)

    Lire l'article
  • Un nouveau film pour promouvoir l'open access +

    Couperin promeut l'open access avec 4 films. Le premier est L’Open Access pour faire connaître et enrichir ses recherches, une interview de Pablo Rauzy, doctorant en informatique à Télécom ParisTech. http://www.oaweekfrance.org/

     

     

    Lire l'article
  • FOSTER : 2e appel à projet pour 2015 +

    FOSTER (Facilitate Open Science Training for European Research), dont Couperin est partenaire, lance un 2e appel à projet pour 2015 :

    http://www.fosteropenscience.eu/project/index.php?option=com_content&view=article&id=49:project-training-call-2015&catid=8&Itemid=304

    Les propositions sont à envoyer jusqu'au 3 novembre 2014.

    Lire l'article
  • Couperin coordonne l'open access week +

    La semaine internationale de l’Open Access (Open Access Week) se déroulera en France du 13 au 26 octobre 2014. Cet événement permet de faire connaitre le libre accès à la communauté scientifique et universitaire, de partager ses connaissances et pratiques, d’approfondir la réflexion autour de ce mouvement. Il est coordonné

    Lire l'article
  • Les deux guides H2020 traduits en français +

    Le service traduction de l’Inist-Cnrs a traduit les deux guides publiés par la Commission européenne pour aider les porteurs de projet du Programme-cadre Horizon 2020.

    1. L’un porte sur le libre accès aux publications scientifiques et aux données de la recherche. Il rappelle le contexte du libre accès et donne quelques
  • Lire l'article
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

Événements

Aucun événement

 


 

  • 1

 

 

ribbonnewsletter-6-bg

ribbontrouverunenego5-bg

ribbondossierdepresse-6bis-bg

Novembre 2014
L Ma Me J V S D
27 28 29 30 31 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

somerights20.frbync  couperin 2012 | Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. | Contacts |site réalisé par Absolu Studio | site hébergé par le CERIMES | Plan du site | English version | feed-image

 

Login Form