Pour savoir où on va, il faut savoir d'où l'on vient

Vous avez
une question ?
Un projet ?

Contactez nous !
 

Contactez-nous

Vous avez une question ? un projet ? 
Vous souhaitez plus d'informations sur un produit ? sur notre offre ? 
Contactez-nous, on vous répond sous 4H.

retour

Moteur de recherche

Moteur de recherche

Il s’agit bien entendu d’une brique essentielle des applications de gestion d’information.

Trois tendances non exclusives existent dans les solutions de GED :

  1. Intégration d’un moteur de recherche, les solutions open source intègre souvent Lucene, moteur de référence du monde open source
  2. Exploitation de la recherche sur de la base de données, ceci peut limiter les fonctions disponibles (notamment lemmatisation, troncatures…)
  3. Ouverture vers des solutions de recherche du marché (propriétaire)
    via des connecteurs

 

Fonctions de base

A minima, le moteur de recherche d’une GED doit :

  • indexer les fiches documentaires, c'est-à-dire toutes les métadonnées d'un document
  • indexer les documents électroniques en texte intégral (ou « full text »), c'est-à-dire en prenant en compte le contenu des fichiers électronique, pour tous ceux qui incluent du contenu textuel
  • filtrer ses résultats de recherche selon les habilitations en lecture de l’utilisateur, c’est-à-dire ne lui proposer que des documents qu’il a le droit de lire
  • permettre des recherches aussi bien sur l’intégralité d’un document que sur un ou plusieurs champs spécifiques de métadonnées.
  • permettre l’utilisation des tables de référence dans les interfaces de recherche
  • permettre les recherches utilisant plusieurs critères associés avec des opérateurs booléens (ET, OU, SAUF), ainsi que des parenthèses
  • permettre de mixer les approches documentaires, sur les métadonnées et le texte intégral
  • autoriser les troncatures centrales et à droite, implicitement ou par l’utilisation de caractères génériques qui remplace un ou plusieurs caractères (classiquement l’étoile « * » ou le « ? »)
  • permettre de personnaliser les pages de recherche, si possible plusieurs pages différentes, pour correspondre aux attentes des utilisateurs

Fonctions avancées

L’utilisation de moteurs élaborés est souvent envisagée pour prendre en charge des fonctions avancées comme :

  • permettre l’enregistrement de résultats sous forme de « panier » par exemple, pour permettre aux utilisateurs de constituer une sélection
  • permettre l’enregistrement des stratégies de recherche, c'est-à-dire les critères utilisés pour la recherche, afin de pouvoir les relancer simplement
  • rechercher successivement de façon à affiner une requête par rapport aux résultats de la recherche précédente
  • étendre une recherche, par rapport à des synonymes par exemple
  • fédérer la recherche sur plusieurs bases documentaires
  • automatiser les approximations, suggestion orthographique et la lemmatisation (c'est-à-dire la recherche sur les racines des mots)
  • permettre la recherche en langage naturel ou recherche par l’exemple, c'est-à-dire déduire l’équation de recherche d’une phrase ou d’un texte interprété par le moteur
  • suggérer des résultats approchant à l’issue d’une recherche, par différents moyens :
    • explicites, via des liens entre documents spécifiés dans
      l’indexation de chacun
    • implicites, des rapprochements issus de calculs statistiques ou sémantiques
  • détecter automatiquement des « entités nommées », c'est-à-dire des noms propres (personnes, lieux) et de leurs relations

 

Parmi les besoins fréquemment évoqués, on retrouve par exemple : la navigation par arborescence, la recherche sur intervalle de dates, la recherche simple (pour les aficionados de Google), la recherche par référence, la recherche fédérée couvrant à la fois la GED et les applications tierces.

Il est donc fondamental d’analyser les attentes des utilisateurs pour définir leurs besoins de recherche. C’est un bon point de départ pour bâtir l’architecture (structure des données et ergonomie) de l’application cible.

Tous les outils proposent une fonction de recherche a minima sur les métadonnées.

 

Les fonctions de recherche plus avancées ne seront pas disponibles nativement et demanderont une intégration ou une configuration.

Parmi les moteurs non open source qui apportent une valeur ajoutée non négligeable, notamment sur le plan sémantique, citons des outils tels que Sinequa, Antidot, Exalead, Polyspot Autonomy ou Fast.