lopez

Internet abierto: estrategias de búsqueda y evaluación de páginas web

Lo primero que se debe reconocer cuando se plantea el estudio de la búsqueda de información es ¿cómo se estructura la información científica? Una aproximación tradicional de la clasificación de la información podría ser la que se expone en: How Scientific Information is Structured. Es fácil reconocer, de una forma muy gráfica, la manera como los bibliotecólogos (las bibliotecas han sido los sitios naturales de acumulación de la información) catalogan toda la información generada a partir de una IDEA (problema). Los resultados de todo proyecto de investigación deben publicarse primero en las revistas especializadas, lo que da origen a más artículos, si el conocimiento generado transforma lo fundamental en la dsiciplina, es factible que dicho conocimiento sea introducido en los textos básicos y que puedan llegar a los diccionarios y enciclopedias. De esta manera cuando un investigador socializa los resultados de sus hallazgos los publica en revistas de reconocido nivel, nacional o internacional. A la fecha se han reportado aproximadamente 80000 revistas que tienen un comité editorial y que realizan un proceso meticuloso de evaluación por parte de pares académicos que tienen la misión de garantizar la credibilidad, la veracidad y la coherencia científica de lo que se publica. En la siguiente dirección encontrará todas las revistas que se publican a la fecha: Genamics. En este análisis no se incluyen las revistas catalogadas como de divulgación (Christian Science Monitor, Economist, National Geographic, New York Times, Scientific American, Vital Speeches of the Day, etc.) ni aquellas agrupadas como "Populares" (Parents, People Weekly, Readers Digest, Sports Illustrated, Time, Vogue, etc) ya que éstas usualmente no publican temas en profundidad y el material no ha sido revisado por pares académicos. Su misión es "bajar" los conociemintos desde la frontera de la ciencia y desde la áridez de los fundamento matemáticos a un nivel que permita que los científicos de otras disciplinas puedan estar al tanto del avance de otras áreas de una manera sencilla y clara.

Teniendo claridad acerca de cómo se publica la información, se pasa ahora a la pregunta ¿Dónde se busca la información científica? La búsqueda de los resultados de los avances científicos se ha podido realizar por diferentes métodos, desde las costosas conexiones telefónicas a través del servicio DIALOG de la década del 80 e inicios de los 90 o el Chemical Abstracts o Biological Abstracts en confusos libros con una letra minúscula, hasta la aparición en 1993 de un evento que ha revolucionado el mundo y su comportamiento: la WEB o el INTERNET. Practicamente todos los proveedores de información reconocieron muy rápidamente sus posibilidades y habilitaron sus servicios por esta vía. Todas las universidades del mundo adquieren estas bases de datos bien sea directamente con el proveedor individual (Elsevier, Wiley, Springer, ACS, RSC, Lipincott, Oxford, etc) o a través de intermediarios con motores de búsqueda que agrupan a su vez a los proveedores individuales (Medline, Ingenta, Ebsco, Ovid, Scifinder, Wilson Web, Dialnet, OCDE, Scopus, Current Contents, etc). En el caso de Colombia y de la Universidad de Antioquia en particular se han realizado esfuerzos financieros para tener acceso a algunas Bases de datos especializdas NO GRATUITAS.

Obtener un dato confiable sobre el tamaño de la Web puede ser una tarea muy difícil. Algunas preguntas que todo usuario de este servicio se hace en todas partes del mundo son:

¿Qué tamaño tiene la Web?

¿Cuántas páginas existen?

¿Se puede afirmar en un momento dado que usted agotó la búsqueda de información sobre un tema dado?

Por el momento es necesario aclarar que existe una gran diferencia entre la búsqueda de información en la Web profunda, quizas 100 veces más grande que la otra Web, conformada por los grandes reservorios de información académica no gratuitas y la búsqueda de información en la Web abierta, la cual está disponible de manera gratuita. La diferencia fundamental está en que en la web profunda se publica información que ha sido revisada por un comité editorial, en este sentido cuenta con un respaldo académico respecto a la credibilidad y confiabilidad de dicha información. Lo cual no sucede con la web abierta, en la cual, no sólo es necesario aplicar ciertas estrategias de búsqueda sino que es necesario evaluar la información que se recupera.

Vale la pena anotar que en la página de inicio de Google aparecía un dato muy interesante en el cual se referenciaba, hasta hace poco, la cifra de páginas que hay publicadas en Internet: 8168684336 (Septiembre de 2005). Por razones desconocidas Google dejó de mostrar esta estadística desde Agosto del año pasado y se ha notado que la rapidez con la que se matriculan nuevas páginas ha disminuido significativamente. Observe bien el número, escrito de una manera más académica representa el: 8.1x109 páginas ¿Se imagina una Web 500 veces más grande?

Teniendo presente este panorama, el reto para cualquier usuario está en dos frentes:

¿Cómo recupera información relevante?

¿Cómo minimiza el tiempo de búsqueda?

Este módulo se centrará en compartir las herramientas disponibles para desarrollar estrategias de búsqueda y valoración de la información publicada en la web abierta. Los aspectos relacionados con la recuperación y valoración de material indexado en revistas y bases de datos no serán abordados en esta introducción. Para esto se sugiere acudir a la biblioteca para solicitar una asesoría al respecto.

¿Qué estrategias de búsqueda utilizar y cómo valorar la información publicada en internet? Como se manifiesta gráficamente en este mapa, el usuario debe tomar decisAiones importantes para una óptima navegación antes de comenzar cualquier tipo de búsqueda:

  1. ¿Qué navegador utilizar? ¿Qué motor de búsqueda podría resolver de manera más eficiente su problema y ¿Cómo recuperar la información que se almacena en el propio PC?

    No existe un sólo motor que resuelva todos los aspectos, de hecho existen más de 500 motores generales y específicos. En la práctica se pueden hablar de unos 40 motores, entre ellos Google, que realiza grandes esfuerzos en brindar servicios y estructuras de búsqueda propios. Sin embargo, un usario no se sometería a gastar el tiempo en una estrategia para aplicarla de manera sistemática en 4 o más motores. Este inconveniente dió origen a los "Metabuscadores", programas que funcionan dentro del navegador normal pero que realizan las búsquedas de manera sumultánea en 20 o más motores, tiene ventajas como la rapidez pero no son tan potentes como cada motor individual. Una de las mayores desventajas de los motores de búsqueda hoy día es la imposibilidad de"congelar" en un instante dado los resultados de una búsqueda o tener la posibilidad de "guardar" los resultados y continuar en un futuro cercano la evaluación de los resultados de una estrategia dada. Para tal necesidad se han creado programas que permiten hacer esto y mucho más, Webferret y Copernic son los programas, con versiones académicas gratuitas. Para recuperar la información desde cualquier dispositivos de almacenamiento existen diversos programas comerciales como EndNote o Reference Manager.

  2. ¿Qué programas adicionales debe tener instalados en su computador para poder visualizar todos los materiales publicados en la web?

    Ahora bien, otro aspecto que es necesario contemplar es la descarga y el almacenamiento de la información en cualquier formato: imágenes, artículos, videos, animaciones, programas, direcciones de páginas, libros y aún enciclopedias completas.

    Antes de abordar propiamente las estrategias de búsqueda, es necesario tener en cuenta que cuando se ingresa a cualquier motor de búsqueda, la pantalla inicial que se carga reconoce "automáticamente" el país de donde le solicitan el servicio. Por ejemplo, si cargamos Google, inmediatamente aparece Google Colombia o si estamos en España será Google España o Google Argentina o Google Brasil. Este hecho tiene un enorme impacto sobre las opciones adicionales que tienen estas páginas. Esto puede confirmarlo entrando a Google Colombia y en otra página a Google en Inglés. En el navegador con Google en español al entrar por MAS y en el Google en Inglés al entrar por MORE se observan marcadas diferencias respecto a las opciones y recursos disponibles. Así mismo sucede en el momento de hacer una búsqueda, las páginas que se recuperan en inglés sobrepasan las cifras de las recuperadas en español. Teniendo en cuenta esta diferencia se recomienda, en la medida de lo posible, realizar las búsquedas en un buscador en inglés.

¿Cómo buscar en Google?

Teniendo en cuenta que todos los buscadores se comportan de una manera más o menos similar, se aprenderá a utilizar un buscador, en este caso Google. Sin embargo, lo ideal es que después de aprender a manejar bien este buscador se compararen las opciones de búsqueda y la sintaxis con otros buscadores como: Alltheweb, Altavista, Ask Jeeves y Hotbot.

Si bien mas del 90% de los usuarios sólo utilizan el campo principal de búsqueda con no más de tres palabras, el resultado final es un alud de sitios que sepultan la información y desmotivan al momento de revisar cientos o quizás millones de resultados. Pero precisamente para que esto no suceda se va a utilizar sólo la búsqueda avanzada (Advanced Search) y la mayor cantidad de "filtros" posibles con el fin de refinar las búsquedas.

¿Cómo evaluar la información recuperada?

Ante cualquier estategia de búsqueda su motor elegido entregará una gran lista de sitios, la pregunta sigiente deberá ser: ¿Cómo evalúo la calidad de las páginas halladas? Algunas referencias para abordar este otro problema son: Evaluating Web Sites: Criteria and Tools o Evaluating Internet Research Sources (Sitio en Español, recomendable La Utilizacion del Internet en la enseñanza de la Historia).

¿Cómo citar recursos de internet?

Para esta pregunta existen dos respuestas, en el mundo se aceptan dos formatos: MLA y APA (Citation Styles). Les recomiendo visitar las siguientes páginas que le ilustran como hacerlo dependiendo del formato que usted haya escogido, el servico es gratuito: Citation Machine y Citation Styles Machine

Aquí un completo listado de bibliotecas digitales en inglés y español.