Recommander

IRUS-UK : Statistiques d'usage pour les dépôts institutionnels

  • Dernière Modification
    jeudi 20 avril 2017

Présentation du projet

Le projet britannique IRUS-UK (qui signifie Institutional Repository Usage Statistics - UK ou "statistiques d'usage des dépôts institutionnels pour le Royaume Uni") s'appuie sur les résultats de PIRUS2 pour développer un service de production de données d'usage qui respectent la norme COUNTER.

C'est un projet financé par le JISC dans le cadre de UK RepositoryNet+, et mené par un consortium formé du Mimas, de l'université de Cranfield et d'Evidence Base (équipe identique à celle du JUSP).

Mesurer les téléchargements d'items dans les dépôts institutionnels

A la différence du guide de bonnes pratiques PIRUS qui propose (au moins dans un premier temps) une métrique au niveau de l'article de périodique en texte intégral, IRUS-UK s'intéresse au nombre de téléchargements d'items, incluant ainsi par exemple les chapitres d'ouvrages. 

Deux scénarios techniques ont été considérés pour la récupération des données et c'est la technologie des trackers qui a été adoptée, plus facile à mettre en oeuvre et dont les plugins existent déjà pour les dépôts DSpace and Eprints. La solution de moissonnage OAI-PMH a été abandonnée.

Un tracker (ou pisteur) est l'équivalent de la fonctionnalité "Google Analytics" pour les téléchargements d'items côté serveur, qui diffuse les métadonnées à un serveur tiers sous la forme de couples clés/valeurs OpenURL.

La technique

Les logs IRUS sont constitué de chaînes de caractères au format OpenURL (clé = valeurs) qu'on peut décomposer : 

  • url_ver=Z39.88-2004
  • url_tim=2012-07-05T22%3A59%3A59Z&
  • req_id=urn%3Aip%3A86.15.47.114&
  • req_dat=Mozilla%2F5.0+(iPhone%3B+U%3B+CPU+iPhone+OS+5_1_1+like+Mac+OS+X%3B+enus)+AppleWebKit%2F534.46.0+(KHTML%2C+like+Gecko)+CriOS%2F19.0.1084.60+Mobile%2F9B208+Safari%2F7534.48.3&
  • rft.artnum=oai%3Aeprints.hud.ac.uk%3A8795&
  • svc_format=application%2Fpdf&
  • rfr_id=eprints.hud.ac.uk HTTP/1.1" 200 - "-" "EPrints 3.2.2 (Chocolate Cake) [Born on 2010-05-25]"

C'est ce que chaque tracker installé sur les dépôts institutionnels enverra à IRUS-UK quand un téléchargement d'item se produira.

Ces chaines de caractères OpenURL sont stockées dans des fichiers logs journaliers et sont traitées le jour suivant, en quatre étapes :

  1. un script Perl analyse les logs, les filtre selon les recommandations COUNTER (élimination de l'activité provoquée par les robots), génère des données d'usage brutes et un fichier intermédiaire
  2. le fichier intermédiaire est analysé (utilisation de l'identifiant OAI) et inscrit en base de données les informations déjà disponibles
  3. un script Perl obtient les métadonnées OAI_DC manquantes en utilisant l'identifiant OAI pour générer une requête OAI-PMH "GetRecord"
  4. un traitement mensuel est mis en oeuvre pour consolider les statistiques journalières en rapports à la granularité COUNTER, moissonnables via SUSHI

Pour le détail du format des données traitées, des rapports produits et de la chaîne de traitement en jeu, veuillez consulter le diaporama de la présentation faite en novembre (pdf).

Les participants

Depuis mars 2013 où 16 dépôts institutionnels s'étaient vus équiper d'un tracker et plus de 2 millions de téléchargement d'items avaient déjà été comptabilisés, ce sont désormais (avril 2017) 126 dépôts qui participent et plus de 80 millions de téléchargement d'items !

Sources