14.7.04

Los secretos de Internet: La web invisible.

La web también tiene sus secretos. Hoy leyendo un artículo de Octavio Islas y Fernando
Gutiérrez acerca de la investigación periodística a través de la Red, me encontré con el término web invisible.

La web visible son aquellas páginas que aparecen como resultado en los buscadores generalistas, la web invisible son las páginas que no aparecen en los resultados de búsqueda.

Hay dos razones para que los motores de búsqueda no contengan una páginas:

  • barreras técnicas que prohiben el acceso

  • una decisión de excluir la página


Esta parte oculta de la Red está constituida en su mayoría por miles de bases de datos especializadas que pueden accesarse vía Internet. Los resultados de búsqueda en estas bases de datos son presentados al usuario en páginas web creadas exclusivamente en respuesta a la búsqueda realizada. Estas páginas generalmente no están almacenadas porque resulta más conveniente (y barato) generar una página-respuesta para cada búsqueda que almacenar todas las posibles páginas que contendrán todas las posibles respuestas a las búsquedas que se hagan en la base de datos.

Los buscadores no pueden llegar a la página porque simplemente no existe hasta que alguien realiza la búsqueda.

Parte de la web invisible son páginas excluidas por las políticas de los buscadores. No hay razones técnicas por las que no podrían incluirse, se trata de una decisión de incluir o excluir una página en una base de datos (el buscador) que es de por sí­ inmensa y de costosa operación.

Cómo buscar en la web invisible

Piensa en que está formada por bases de datos.  Éstas pueden encontrarse fácilmente en los buscadores si se utiliza el término "base de datos" o "database" en inglés y se añade la palabra que defina el interés de tu búsqueda.

Ejemplo: Teclea en el buscador "Base de datos" + periódicos

También existen directorios o buscadores para las bases de datos, entre los más útiles para la investigación acedémica están




Fuentes

Invisible Web: What it is, Why it exists, How to find it, and Its inherent ambiguity.
UC Berkeley.

Investigar por la gran red  por Islas y Gutiérrez en Revista Mexicana de Comunicación