Pour savoir où on va, il faut savoir d'où l'on vient

Vous avez
une question ?
Un projet ?

Contactez nous !
 

Contactez-nous

Vous avez une question ? un projet ? 
Vous souhaitez plus d'informations sur un produit ? sur notre offre ? 
Contactez-nous, on vous répond sous 4H.

eZHumanCAPTCHACode reload
retour

Référentiel de classement

Référentiel de classement

Un référentiel de classement est, avant tout, un ensemble structuré de mots clés ou d’expressions. On parle aussi de « vocabulaires » métiers.

Les solutions GED proposent des implémentations plus ou moins profondes, à la fois en terme de complexité des référentiels (hiérarchie, liens typés...) et en termes d’utilisations possibles.

L’extensibilité des solutions présente un intérêt tout particulier, puisqu’elle permet d’envisager d’étendre le modèle de référentiel en fonction des besoins (voir « Ontologie », page 52).

Types de référentiels

Lexique

Il s’agit d’une liste des termes utiles dans un contexte donné et organisé le plus souvent de façon alphabétique. Il est parfois possible d'en donner une définition.

Plan de classement

Un plan de classement est un ensemble de termes hiérarchisés logiquement les uns par rapport aux autres.

Il s’agit du référentiel utilisé pour réaliser des classements physiques (papier ou autres).

On trouve souvent des cotes ou codes affectés à chaque terme. L’utilisation classique du plan de classement, consiste à ranger physiquement les documents en affectant à chacun un et un seul terme du plan de classement.

Dans un usage électronique, il devient possible d’affecter plusieurs termes du plan de classement à un même document, ce qui donne autant de « clés » pour le retrouver. Une catégorisation multiple donc.

Thésaurus

En plus de la structure logique et hiérarchique du plan de classement, le thésaurus introduit plusieurs notions permettant d’enrichir l’utilisation du référentiel documentaire. Le thésaurus est un ensemble de termes parfaitement définis, sur lequel on s’appuie dans un domaine d’application particulier.

Plusieurs normes ISO définissent des relations entre les termes dits « descripteurs » qui constituent un thésaurus. Parmi les plus courantes, on retiendra :

  • terme « générique », qui correspond au « père » dans la hiérarchie.Un terme peut avoir plusieurs « pères »
  • terme « spécifique », qui correspond un « fils » dans la hiérarchie
  • terme « employé pour », qui correspond aux synonymes dont on ne retient pas l’utilisation dans le référentiel, mais qui pourraient être employés à la place du descripteur retenu
  • terme proche (« voir aussi »), qui définit des liens transversaux entre termes descripteurs, du fait de leur proximité sémantique

Tableau de gestion

En matière de GED, le tableau de gestion sert à établir les politiques de conservation, c'est-à-dire les règles qui présideront à la conservation des documents électroniques.

Le tableau de gestion est généralement construit sur la base d’un plan de classement.

Un tableau de gestion associe à chaque terme plusieurs informations :

  • la durée de conservation : éventuellement une duréeopérationnelle (dans le bureau) et obligatoirement une durée d’archivage
  • le « sort final » à l’issue de la durée d’archivage
  • les textes de référence qui justifient la durée de conservation, procédure qualité, loi, règlement… afin de permettre la révision

Tout l’intérêt de cet outil est de permettre d’associer des durées et des conditions de conservations à chaque élément du corpus documentaire (document ou dossier) en fonction d’une classification. Cet outil est indispensable à l’application de règles de conservation.

Son utilité est spécifique au domaine des archives et de la conservation des archives vitales, c'est-à-dire le record management.

Ontologie

Les ontologies fonctionnent sur le même principe que les thesaurus, c'est-à-dire par la mise en place de relations entre termes. Il s’agit d’un type de référentiel « extensible », c'est-à-dire dont la structure même prévoit qu’elle peut évoluer.

Deux exemples de liens : « a pour fournisseur » / « est fournisseur de », « est la filiale de » / « est la société mère de ».

Il s'agit d'un outil qui n'est pas implémenté dans les solutions de GED,certains permettent néanmoins, de par la structuration XML de leur référentiel de classement, de mettre en œuvre ce type d'outil.

A la différence des thesaurus, il n’y a pas de prédétermination, ni de limitation dans les types de relations. Il est donc possible de créer autant de relations qu’on le souhaite, entre les termes d’une ontologie et d’y associer contraintes et règles d’inférences.

Leur exploitation est encore assez limitée aujourd’hui et essentiellement basée sur les RDF (Ressource Description Framework), modèle de représentation d’ontologie, normalisée par le W3C.

Le concept d’ontologies est à la base du web sémantique, l’évolution pressentie par Tim Berners Lee pour rendre le web plus « intelligent » en permettant à des machines de réaliser seules des associations pertinentes entre contenus.

Dans le cadre d’une application documentaire, la mise en place d’ontologie(s) permet de disposer d’outils extrêmement puissants et adaptables à la fois au corpus documentaire traité et aux profils des utilisateurs.

Une ontologie peut, par exemple, définir des relations métiers qui pourront être exploitées par un moteur de recherche, en fonction du profil de l’utilisateur ou de son « optique » de recherche. Elles pourraient également permettre de définir des plans de classement contextuels en fonction de paramètres qui indiquent quels liens de l’ontologique sont utilisés.

Utilisation des référentiels

Etudions quelques utilisations envisageables.

 

Restitution des contenus

La navigation par arborescence permet à l’utilisateur de retrouver un document selon une logique hiérarchique, voire plusieurs logiques hiérarchiques différentes.

 

Ainsi, si un contenu est référencé, catégorisé selon /Europe/France/Paris, mais également selon /Etablissements/Restaurants/Trois-Etoiles, l’utilisateur pourra parvenir à ce contenu par une navigation correspondant à la logique (ou « facette ») géographique, ou bien à la logique (ou « facette ») gastronomique.

Cette approche est très puissante, puisqu’elle propose à chaque utilisateur une vision et une exploitation de la base documentaire qui correspond à son usage.

Gestion multi référentiels

Dans un contexte professionnel, on est souvent amené à présenter une même information à différents publics. On doit parfois gérer plusieurs ensembles de vocabulaires contrôlés, par exemple une liste de mots-clés et une liste d’unités organisationnelles.

La gestion multiréférentielle impose de gérer certains cas difficiles tels que les homonymies, les liens entre référentiels… La plupart des applications GED étudiées disposent d’un seul référentiel de classement complexe (lorsqu’elles en disposent), il est donc important de valider la cohabitation de plusieurs référentiels si besoin.

Gestion des synonymes

Il s’agit, pour un vocabulaire donné, de pouvoir non seulement gérer les synonymes et les acronymes, mais également de rendre leur utilisation aussi transparente que possible à l’utilisateur.
Les fonctions les plus utiles sont :

  • Enrichissement facile de la base de synonymes, éventuellement par les utilisateurs eux-mêmes
  • Utilisation automatique des synonymes lors d’une recherche sur le terme principale (voir Outil de recherche, infra)
  • Détection automatique et remplacement des synonymes par le terme retenu lors de l’indexation, afin d’homogénéiser l’indexation

Outil de recherche

Les relations des référentiels peuvent être utilisées de différentes façons par le moteur de recherche.

Expansion de requêtes

Une exploitation possible de référentiels riches est de permettre de définir l’environnement sémantique d’un terme. Certains moteurs de recherche sont ainsi capables « d’étendre la recherche » automatiquement en utilisant les relations indiquées dans le référentiel.

Par exemple, en indiquant automatiquement avec un « OU booléen » qu’une recherche faite sur le terme « voiture » concerne également tout ce qui parle de « automobile », de « bagnole »... Ainsi, tous les documents qui contiennent ces termes seront effectivement dans les résultats de recherche (réduction du silence).

Le moteur peut également étendre la requête par proximité sémantique, par exemple entre pêcheur, bateau, poisson...

Les « expanseurs » de requête peuvent également reposer sur des analyseurs syntaxiques ou sémantiques, qui construisent automatiquement des dictionnaires de correspondance à partir de l’analyse des documents indexés.

Suggestion à l’utilisateur

L’analyse des mots-clés du référentiel trouvés dans les fiches des réponses à une requête donne une autre occasion d’exploiter les référentiels existants.

Par exemple, en proposant à l’utilisateur des termes proches de ceux trouvés le plus fréquemment dans les résultats de sa recherche.

Ce type d’utilisation est souvent plus riche lorsqu’on utilise un moteur syntaxique ou sémantique, pour réaliser ces associations de mots-clés.

Représentation en cluster

Il s’agit ici de ranger un ensemble de documents selon une arborescence de mots-clés en rapport avec ces documents.

Lorsque le regroupement est fait à partir d’une liste préétablie de valeurs dans un ou plusieurs champs, on parle de catégorisation.

Le terme de cluster est généralement réservé aux solutions qui proposent un calcul dynamique basé sur l’analyse de termes présents dans les documents eux-mêmes.

Ce type de fonction est utilisé pour représenter des résultats de recherche sous la forme d’une arborescence structurée par thème ou par domaine par exemple. Ainsi, l’utilisateur verra immédiatement les thématiques représentées dans les documents trouvés et pourra, le cas échéant, préciser sa requête en ajoutant ou excluant certains termes du cluster.