Come abbiamo ormai capito, non sempre il titolo di un documento costituisce un elemento sufficiente a fornirci indicazioni precise circa il contenuto: potremmo avere un titoli che non contengono alcun termine attinente agli argomenti trattati, oppure titoli costituiti da parole che hanno più di un significato (per esempio, un titolo come
La pesca non è chiaro se si riferisce al frutto o all’attività del pescatore).
Anche le classificazioni non consentono tutti i tipi di ricerche su argomenti. Le classificazioni si rivelano carenti soprattutto in relazione a soggetti interdisciplinari o molto specifici, o trattati secondo particolari punti di vista.
Per ovviare a questi problemi le biblioteche mettono a disposizione un ulteriore insieme di strumenti per la ricerca e il recupero di informazioni circa documenti su un argomento specifico, basati su parole scelte all'interno di vocabolari controllati: soggetti, thesauri e keyword.
In questi strumenti il contenuto concettuale dei documenti è rappresentato in modo strutturato e controllato, utilizzando un linguaggio uniforme, in modo che lo stesso concetto sia espresso sempre nello stesso modo.
Questi strumenti sono il risultato di un vero e proprio lavoro di "indicizzazione", mediante il quale delle persone (e non una macchina) forniscono gli elementi per rispondere alle domande:
- Di cosa tratta quel documento?
- Qual è l'oggetto principale di studio di quel testo?
Sinora tutti i tentativi di automatizzare questo lavoro hanno dato scarsi risultati e il ricorso alla figura dell’indicizzatore appare ancora necessario; questi infatti, dopo aver analizzato il documento nelle sue parti, valuta quali sono i concetti fondamentali che vi sono espressi e seleziona da un insieme di termini controllati delle parole (i termini di indicizzazione, appunto) che riflettono nel miglior modo possibile l'argomento o gli argomenti presenti nel testo esaminato.