Información básica y segura sobre la Deep Web.

Hace un tiempo hice un artículo acerca de mi experiencia entrando a la Deep Web, me pareció necesario hacer otro artículo explicando un poco mas acerca de esto.

La Deep Web se define generalmente como el contenido en la Web que no es accesible a través de una búsqueda en los motores de búsqueda conocidos, valga la redundancia. Este contenido también es referido como HIDDEN o INVISIBLE WEB.

La Web es una entidad compleja que contiene información de una variedad de fuentes e incluye una mezcla cambiante de diferentes tipos de archivos y medios de comunicación. Es mucho más que páginas estáticas o webs independientes. De hecho, la parte de la web que no es estática, y que sirve de forma dinámica, es mucho más grande que los documentos estáticos que muchos asocian con la Web.

El concepto de la Deep Web es cada vez más complejo ya que los motores de búsqueda han encontrado la manera de integrar contenido de la Deep Web en su sección de “más resultados” luego de las búsquedas principales. Esto incluye desde vuelos de aviones, noticias sobre las cotizaciones de acciones o direcciones de mapas con las actividades de las cuentas de Facebook. En la pantalla de abajo, note las diferentes fuentes de la deep web prestadas por Google, incluyendo imágenes, mapas, noticias, videos, compras, contenido académico, blogs, etc. Sin embargo, incluso un motor de búsqueda de largo alcance como Google proporciona acceso a sólo una parte muy pequeña de la deep Web.

Contenido en la deep Web

Cuando nos referimos a la deep Web, usualmente estamos hablando de lo siguiente:

  • Contenido de bases de datos. Las bases de datos contienen información almacenada en las tablas creadas por programas como Access, Oracle, SQL Server y MySQL. (Hay otros tipos de bases de datos, pero nos centraremos en las tablas de la base de datos por el bien de la simplicidad.) La información almacenada en bases de datos es accesible sólo por consulta. En otras palabras, la base de datos de alguna manera debe ser buscada para recuperar los datos y mostrarse en una página Web. Esto es distinto de páginas web estáticas, autónomas, a las que se pueden acceder directamente. Una importante cantidad de valiosa información en la Web se genera a partir de bases de datos.
  • No textuales, como los archivos multimedia, imágenes, software, y documentos en formatos como “Portable Document Format” (PDF) y Microsoft Word.
  • El contenido disponible en sitios protegidos por contraseñas u otras restricciones. Algo de esto está basado en cuotas de contenido, como contenido de suscripción pagadas por las bibliotecas o las empresas privadas y disposición de sus usuarios en función de diversos esquemas de autenticación.
  • Contenido especial que no se presentan como páginas web, tales como artículos de texto completos y libros
  • Dinámicamente cambiante, contenido actualizado, como las noticias y los vuelos aéreos.

Esta suele ser la base, una lista “tradicional”. En estos días de la web social, vamos a considerar la adición de nuevos contenidos a nuestra lista de fuentes de la Deep Web. Por ejemplo:

  • Publicaciones de blogs
  • Comentarios
  • Discusiones y otras actividades de comunicación en los sitios de redes sociales, por ejemplo Facebook y Twitter.
  • Marcadores y citas almacenadas en sitios de bookmarking sociales.

Como se puede ver, con base en estos ejemplos, la deep Web se está expandiendo.

Consejos para manejar el contenido de la deep Web

  • La BÚSQUEDA VERTICAL puede resolver algunos de los problemas con la deep Web. Con la búsqueda vertical, se puede consultar una recopilación de datos centrados en un tema específico, la industria, tipo de contenido, ubicación geográfica, idioma, tipo de archivo, página web, dato, y así sucesivamente. Por ejemplo, considere MedNar y PubMed para buscar temas médicos. En la web social, hay motores de búsqueda de blogs, feeds RSS, contenido de Twitter, y así sucesivamente. 
  • Use un motor de búsqueda general para localizar un motor de búsqueda vertical. Por ejemplo, una búsqueda en Google de “búsqueda en el mercado de valores” recuperará los sitios que te permiten buscar precios actuales de las acciones, noticias, mercado, etc. Esto puede ser considerado como la búsqueda de dos niveles. Para el primer nivel, la búsqueda de la base de datos de sitio. Para el segundo nivel, vaya al sitio y busque en la propia base de datos para la información que desea.
  • Un número de motores de búsqueda generales buscarán la deep Web por el contenido relacionado con posterioridad a una búsqueda inicial. Por ejemplo, realice una búsqueda en Google para “World Trade Center” y seleccione la pestaña Imágenes. Esto recuperará muchas páginas de imágenes del World Trade Center. Busque este tipo de característica en los motores de búsqueda.
  • Trate de determinar qué tipo de información puede ser almacenada en una base de datos. No hay una regla general. Pero piense en grandes anuncios de cosas con un tema común. Unos pocos ejemplos de contenido databased incluyen:

                            – Guías telefónicas
                            – “Buscadores de gente”, tales como listas de profesionales, y tales como médicos o abogados
                            – Patentes
                            – Leyes
                            – Definiciones de los diccionarios
                            – Artículos a la venta en una tienda en Internet o subastas basadas en la web.
                            – Exposiciones digitales
                            –  Imágenes y multimedia
                            – Textos completos de artículos y libros

  • La información que es nueva y dinámica cambiante en el contenido aparecerá en la deep Web. Mire la deep Web para finales de artículos de última hora, como por ejemplo:

                            – Noticias
                            – Ofertas de trabajo
                            – Vuelos disponibles de avión, habitaciones de hotel
                            – Acciones y bonos, los precios promedios del mercado

  • La web social a menudo salta en una situación de última hora con noticias y comentarios. Blogs, Facebook, Twitter, y otros entornos de redes sociales a veces se salen de la palabra antes que las fuentes más tradicionales.
  • La cobertura de temas sobre la deep Web es muy variada. Esto presenta un desafío, ya que es imposible prever exactamente qué puede aparecer.

“Siga estos consejos, ya que la deep web es un lugar con gran información, pero también puede ser peligrosa.”

Related Posts

Leave a Reply

Your email address will not be published. Required fields are marked *