3.5 L'INDEXACIÓ AUTOMATICA
La indexació automàtica és la selecció d'un conjunt de termes que
representin íntegrament un document (text, imatge, so) per mitjà d'un programa
informàtic.
Fins a finals de la dècada de 1950, la indexació es realitzava a les
Biblioteques o els Centres de Documentació de manera intel·lectual.
És desde llavors que es treballa en automatitzar aquesta tasca.
És desde llavors que es treballa en automatitzar aquesta tasca.
Enfront de la indexació humana ofereix molts avantatges, com són la
rapidesa d'indexació, de recerca i resposta, la multiplicació d'elements de
recuperació.
Algunes de les eines que vénen utilitzant els programes informàtics per
aconseguir una indexació automàtica són les següents:
- Llistes de paraules buides: Fitxer compost per
articles, conjuncions, preposicions, adverbis com ara (el, la, per, per a,
amb, sense, etc.). És a dir, paraules que per si soles no transmeten
càrrega temàtica.
- Revelancia de termes: Ús de la freqüència per
donar valors a les paraules que apareixen a els documents.
- Analitzadors lingüístics: Analitzadors o
etiquetadors morfològics, sintàctics o semàntics per realitzar un
processament de llenguatges naturals.
- Algorisme: Llistat definit i ordenat d'operacions
per solucionar un problema.
- Vocabulari controlat: Llista alfabètica i/o
sistemàtic de terminologia especialitzada.
- Reconeixedors: de noms propis i sigles.


Comentaris
Publica un comentari a l'entrada