X
Revista

Qué es la Deep Web y por qué está catalogada como peligrosa

La llamada Internet Profunda no está indexada a los buscadores que utilizamos con regularidad y se puede encontrar millones de documentos restringidos y hasta prohibidos.

12/08/2019

La Deep Web se traduce al español como ‘Internet profunda’. Y se denomina así por la sencilla razón de que está compuesta por todo aquel contenido de Internet que, por diversos motivos, no está indexado por motores de búsqueda como Bing, Yahoo o el propio Google –entre muchos otros-. Lo que todos los usuarios utilizamos de forma diaria, sin embargo, se denomina ‘Internet superficial’.

 Por qué la Deep Web está ‘oculta’

Para prácticamente cualquier contenido de la deep web lo que se utilizan son dominios con extensión .onion; además, los propios nombres de dominio están codificados con una trama HASH. No hay registro de estos dominios por parte de un servidor DNS, sino que los dominios .onion, con un servicio específico, se encargan de hacer las veces de este DNS. En una red P2P, las bases de datos correspondientes a la resolución de los nombres de dominios HASH se replican para que estén disponibles para todos los usuarios. En lugar de emplear el protocolo UDP/IP para la identificación de páginas web, como en la Internet superficial, en la deep web se repiten por un ramal.

Aunque es popularmente creído que la deep web es peligrosa o ilegal, en ella se ocultan avances tecnológicos y científicos, por ejemplo, en lo que se denomina la Academic Invisible Web. Por otro lado, se cree también que la deep web es más ‘pequeña’ que la Internet superficial y, sin embargo, las últimas estimaciones apuntan a una dimensión entre 400 y 550 veces superior que la Internet superficial. En torno a 550 billones de documentos individuales, frente a 1 billón en la Internet superficial.

Por qué Google (y otros) no pueden indexar los contenidos de la deep web

La deep web mantiene sus webs y archivos ocultos por varios motivos: existe software que ha sido ocultado de forma intencionada y para el cual se requiere de un programa, o de un protocolo específico, para poder acceder. La mayoría de estas páginas web no tienen enlaces de otras páginas web que sirvan como referencia a las ‘arañas’ de los motores de búsqueda para hacer seguimiento y rastreo, y el correspondiente indexado. Además, hay sites dinámicos que dependen de un formulario y de otros parámetros.