Accueil

Circuit du document

Catalogage

Indexation
Mots-clés
Indices
RAMEAU

Cotation

Indexation

Définition

Théorie

L'indexation consiste à donner accès aux documents à partir d'une indication concernant leur contenu et/ou leur nature (forme, type).

On considère souvent que l'indexation (appelée aussi "indexation matière") doit refléter le sens, le contenu du document : il s'agirait d'un travail de traduction (voir ci-dessous les techniques employées). On peut parler ici d'une approche sémantique.

On peut aussi considérer que l'indexation a d'abord pour but de signaler les documents et d'orienter le public vers les documents pertinents : dans cette perspective, il ne s'agit pas seulement de traduire le contenu des documents, il faut aussi donner aux lecteurs les pistes qui le conduiront vers le document. On peut parler ici d'approche sémiologique : indexer, c'est pourvoir le document d'un signe, d'une étiquette qui le signale.

Avantages

Par rapport à une recherche sur les mots des titres (catalogues assez pauvres) ou une recherche en plein texte (sur internet ou dans un traitement de texte), la recherche sur des documents indexés a de grands avantages :

  • les titres ne sont pas toujours significatifs ;
  • il faut donner accès aux documents en langue étrangère ;
  • il faut signaler les documents non textuels : images, sons, objets ;
  • la recherche en plein texte se heurte aux ambiguïtés des langues naturelles : les homonymes ("vol") et les synonymes ("tiers-monde", "pays sous-développés", "pays en voie de développement").

Techniques

Il existe plusieurs manières de faire : utiliser des mots-clés (plus ou moins librement choisis), des indices d'une classification (sorte de symboles), faire des résumés ou des notices critiques.

Dans ce cours, nous ne verrons que les deux premiers cas, seuls utilisés dans les bibliothèques.

Principes

Profondeur de l'indexation

On peut décrire le contenu d'un document de manière générale ou plus ou moins détaillée : tout dépend des besoins du public.
Par exemple, si un seul chapitre dans un livre traite d'un sujet qui intéresse particulièrement les usagers de la bibliothèque, il est utile d'indexer ce chapitre.

Qualité de l'indexation

Une indexation idéale doit être :

  • Pertinente : les mots-clés utilisés doivent rendre compte avec exactitude du contenu du document. Corollaire de ce principe : les mots choisis doivent être aussi peu ambigus que possible.
  • Objective : l'indexeur ne doit pas déformer la pensée de l'auteur (pas toujours si simple pour des sujets controversés).
  • Cohérente : les mêmes mots doivent désigner les mêmes notions. Un même document, dans un même centre de documentation, sera indexé de la même manière par plusieurs personnes, à dix ans d'intervalle (sauf si le public a changé).
Petite question pour plus tard

Comment RAMEAU traite-t-il le problème du droit du foetus ?
Si le foetus est considéré comme une personne, il a des droits ; dans le cas contraire, il n'a pas de droits au sens strict. C'est un exemple de question controversée.

Interface document-usagers

Les bibliothèques ont pour vocation de faire se rencontrer les documents et les usagers. Ce principe est illustré de manière éclatante dans le cas de l'indexation :

  • d'un côté, l'indexation utilise des termes rendant compte du contenu du document (le plus souvent en vocabulaire contrôlé)
  • de l'autre, le public cherche les documents en utilisant ses propres termes (en langage naturel)

Un système d'indexation qui marche doit faire coïncider les deux vocabulaires.