“La recuperación de información automatizada se ha estudiado, como señalan Salton, Cleverdon y otros autores clásicos de la teoría de la recuperación de información, atendiendo a tres aspectos principales: «estructuras de información, análisis de contenido, y evaluación» (Rijsbergen, 1979), observados, a su vez, desde una doble perspectiva. Por un lado un enfoque tecnológico o algorítmico, y, por otro, una perspectiva semántica o cognitiva. Ante el problema de la recuperación de información en Internet, podemos identificar igualmente dos tendencias:

 

1) Una tecnológica, protagonizada por el perfeccionamiento de las técnicas de indización automática en texto completo, el procesamiento del lenguaje natural y el desarrollo de nuevos algoritmos de búsqueda y recuperación de información. En esta tendencia podemos destacar la insuficiencia de los motores y servicios de recuperación de información actuales, debida fundamentalmente a la heterogeneidad de los datos distribuidos en la Red, a la propia naturaleza fragmentada de la indización, a la cobertura incompleta y a su propia incompatibilidad. En este sentido, solo podemos señalar la pretendida funcionalidad de las metaetiquetas HTML y del marcado de procedimiento de este lenguaje para aumentar la visibilidad y la promoción de los recursos y paginas Web en sistemas genéricos de recuperación de información en Internet.

 

2) Una tendencia semántica, a la que pertenecería el desarrollo de modelos de metadatos para estructurar la información, y la implementación de vocabularios controlados y listas de autoridad para organizar el contenido de esos metadatos. Bajo este enfoque semántico están surgiendo nuevos sistemas de recuperación de información vinculados a áreas del conocimiento concretas, que basan la formación de sus colecciones virtuales en la selección de recursos, y la recuperación, en esquemas de metainformación estructurada. Contextos abarcables o finitos de información, sea su finitud debida al límite físico (por ejemplo, una Intranet), al límite de gestión local de acceso global (como en el caso de una biblioteca digital propiamente dicha), o al límite temático (como en las subject gateways o las clearinghouses) En estas bibliotecas digitales o sistemas de información es donde realmente existe un control sobre las colecciones y donde se puede basar la recuperación en sistemas de metadatos.

 

Ambas tendencias coincidirán en el planteamiento de la Web Semántica, y nos permiten abordar la recuperación de información en la Web desde una perspectiva semiótica y de cariz bibliotecario, vinculada a la necesidad de establecer metainformación estructurada como alternativa en la organización de colecciones de objetos de información digital”.

 

MÉNDEZ RODRÍGUEZ, Eva Mª. Metadatos y recuperación de información: estándares, problemas y aplicabilidad en bibliotecas digitales. Gijón: Trea, 2002.