miércoles, 3 de abril de 2013

¿Cómo funciona el buscador más famoso del mundo?

¿Qué es Google? La respuesta es simple. Google es un motor de búsqueda en internet que lo que hace es ayudarte a buscar los lugares web mas reconocidos e importantes para que encuentres la información que estás buscando. La popularidad de este buscador se debe a que el posicionamiento de los sitios web no se basan en el número de enlaces entrantes sino en la calidad de los mismos.

De este modo,Google apuesta por las páginas web que ofrecen una mayor cantidad de contenido y de mejor calidad.
Google nos muestra como funciona desde dentro su famoso buscador. Para explicar este proceso, desde que el usuario introduce la búsqueda hasta que muestra los resultados, google lo distingue en 3 fases:

1. Rastreo e indexación:
La búsqueda empieza antes de escribir una consulta. Primero se rastrean e indexan (se registran ordenadamente datos e informaciones para elaborar un índice) billones de documentos de la Web.
Estos procesos sientan las bases sobre cómo se recopila y organiza la información de la Web para ofrecer los resultados más útiles. Para obtener más información sobre las bases, puedes ver este vídeo.


Para ello, Google utiliza un software denominado "rastreador web" para descubrir páginas web de dominio público. El más conocido es "Googlebot". Los rastreadores consultan las páginas web y siguen los enlaces que aparecen en ellas. Pasan de un enlace a otro y recopilan datos sobre esas páginas web que proporcionan a los servidores de Google.
En 1999, Google almacenaba alrededor de 50 millones de páginas. En la actualidad, Google almacena más de 100.000 millones de páginas. Es decir, un crecimiento de un 1 a 2000.
Aun así, en 1999 Google tardaba aproximadamente un mes en encontrar por sí mismo nuevas páginas, hoy, a pesar de trabajar con un volumen 2000 veces mayor, tarda sólo unos segundos.

En resumen, Google recopila las páginas durante el proceso de rastreo y, a continuación, crea un índice, que no es más que organizar la información de la forma más eficiente posible, para poder presentar los resultados de la forma más rápida y acertada. Por ejemplo, si buscamos “FaceBook”, obtenemos en 0.34 segundos, que Google tiene almacenados 21.950 millones de páginas y nos muestra las 10 más relevantes.

2. Los algoritmos (programas informáticos que buscan pistas para ofrecer los resultados más relevantes).
Para cada búsqueda hay miles o millones de páginas web con información útil. Los algoritmos son fórmulas y procesos informáticos que convierten las preguntas en respuestas. Actualmente, los algoritmos de Google se basan en más de 200 señales únicas o "pistas" que permiten adivinar lo que realmente se podría estar buscando. Estas señales incluyen, entre otros, los términos de los sitios web, la actualidad del contenido, la región y el PageRank.
Para mejorar sus sistemas y tecnología se actualizan constantemente para ofrecer mejores resultados. Muchos de estos cambios conllevan la aparición de innovaciones como, por ejemplo, Knowledge Graph o Google Instant.

3. Lucha contra el Spam 
Google lucha contra el spam mediante una combinación de algoritmos informáticos y revisiones manuales.
Los sitios de spam intentan aparecer en los primeros resultados de búsqueda mediante técnicas como, por ejemplo, la repetición de palabras clave, la compra de enlaces que mejoran el PageRank o el uso de texto invisible. Esto es perjudicial para la búsqueda, porque los sitios web relevantes quedan enterrados, y para los propietarios de sitios web legítimos, porque sus sitios se vuelven más difíciles de encontrar. Para evitar el éxito de esta práctica, los algoritmos de Google detectan la gran mayoría del spam y bajan su posición de forma automática. Para el resto, poseen equipos que revisan manualmente los sitios.
Cuando se aplica una acción manual en un sitio web, se trata de alertar al propietario del sitio para ayudarlo a solucionar los problemas. Una vez que el propietario de un sitio web haya limpiado su sitio para eliminar contenido fraudulento, puede solicitar que se vuelva a revisar. Para ello, deberá enviar una solicitud de reconsideración.


Alba Domínguez Domínguez

3 comentarios:

  1. Es increíble como un proceso de búsqueda tan complicado y, sobre todo, amplio tiene lugar en décimas de segundo. Me llama especialmente la atención que uno de los principales criterios de ordenación de los resultados de una búsqueda sea la calidad de los contenidos y me pregunto con qué pautas se determinará la calidad de cada resultado de búsqueda. Tengo entendido que un criterio empleado para posicionar un resultado en un puesto más elevado de la lista es precisamente la 'popularidad' del mismo, es decir, el resultado ocupará un puesto más alto en función de las veces que haya sido consultado por diferentes usuarios, lo cual me parece un criterio poco útil si tenemos en cuenta que lo normal no es consultar mucho más de los diez primeros puestos, contribuyendo con ello a que estos no varíen, pero no sé hasta que punto eso es cierto.
    Sin duda, lo mejor de Google creo que es la gran cantidad de contenidos que puedes encontrar sobre un tema y la facilidad con la que puedes acceder a ellos.


    Rubén Alonso Almagro

    ResponderEliminar
  2. Sinceramente entro en Google a diario sin pararme a pensar en ningún momento que mecanismos o pasos sigue la compañía para organizar mi búsqueda. Ahora que nos has demostrado que siempre se realizan una serie de pasos desde la introducción de lo que queremos buscar hasta que los resultados aparecen, me parece que la rapidez de búsqueda entre millones de resultados es impecable porque en segundos tenemos ante nosotros una lista de páginas clasificadas según la fiabilidad y el número de visitas en relación al tema que buscamos.
    Me gustaría destacar a mi parecer la importancia del tercer paso porque es lo que nos permite a los usuarios de este buscador no acceder de forma constante a páginas falsas que no contienen en absoluto datos relacionados con lo que queríamos buscar, me parece un gran trabajo por parte de Google el evitar a sus usuarios la visualización de páginas basura.

    Para mi, Google es el mejor buscador, no porque nos lo hayan metido por los ojos desde que cogemos un ordenador sino porque el acceso a la información y la búsqueda de la misma es mucho más rapido y eficaz que con otros buscadores como msn, ciao o bing que no te abren una sola pestaña sino que te abren una de direcciones y otra con el resultado que se quiere visualizar.

    Natalia Fernández Oliva

    ResponderEliminar
  3. Estando de acuerdo tanto con Rubén como con Natalia, solo me queda reforzar la idea de que Google es el mejor buscados que podemos encontrar en Internet.
    Cuando abro Internet en mi ordenador, se me abren tres ventanas con tres buscadores distintos de los que no conozco ni el nombre y siempre acabo en Google, sin darle una oportunidad a los demás.
    Es increíble todo el proceso de organización que tiene que llevarse a cabo, millones y millones de páginas de las que únicamente buscas una. Por ello es tan importante cada uno de los pasos.

    Natalia Rivas Recio

    ResponderEliminar