Accueil

Circuit du document

Catalogage

Indexation
• Mots-clés
Indices
RAMEAU

Cotation

Indexation par mots-clés

Principe

L'indexation par mots-clés est le système le plus simple : à un endroit particulier d'un document, dans une zone appropriée d'une notice bibliographique (par exemple, la zone 610 en Unimarc), etc., il suffit de taper un ou plusieurs termes donnant une idée du contenu du document. Les termes sont choisis par l'auteur ou par l'indexeur, librement ou dans une liste d'autorités.
Les termes sont simplement juxtaposés. Pour être sûr que les usagers retrouveront le document, il faut multiplier les termes : synonymes, termes plus généraux, abréviation, etc.

Ce système a quelques avantages : facilité pour l'indexeur, précision des termes (ils sont souvent tirés tels quels du document).

En revanche, les inconvénients sont immenses : trop grand nombre de termes (il en manquera toujours parmi les nombreux synonymes possibles), imprécision des termes ("anglais" : le peuple ou la langue ? "grues" : les oiseaux ou les appareils ?) et absence de syntaxe ("anglais russe grammaire" : grammaire du russe en anglais, ou grammaire de l'anglais en russe ?).

Exemples

Pages web : attribut keywords

La balise <meta> en HTML, avec l'attribut name="keywords" permet d'indexer le document avec des mots-clés. Ces mots-clés sont repérés par les robots qui construisent les moteurs de recherche sur internet.

Voici cette balise pour la première page de ce cours :

<meta lang="fr" name="keywords" content="Circuit du document, Catalogage, Indexation">

Pages web : le Dublin Core

Le Dublin Core est un ensemble de prescriptions permettant d'indexer assez précisément les documents sur internet.
Entre autres possibilités, il est admis d'indexer par mots-clés
Vous avez de bons exemples sur cette page.

Le même exemple donné ci-dessus donnerait :

<meta name    = "DC.Subject"
      content = "Circuit du document Catalogage Indexation">