.
Mostrando entradas con la etiqueta Buscadores. Mostrar todas las entradas
Mostrando entradas con la etiqueta Buscadores. Mostrar todas las entradas

viernes, 12 de febrero de 2010

Bing gana terreno a Google y Yahoo en enero

Bing está ganando posiciones en el mercado estadounidense frente a sus competidores Google y Yahoo. Así lo afirma el último estudio decomScore, que muestra que el de Microsoft ganó cuota de mercado exactamente en la misma medida que la perdieron los dos gigantes de las búsquedas.
Bing come terreno a Google y Yahoo en enero Así las cosas, el buscador de Microsoft ya se lleva en EE.UU. un 11,3 por ciento de las búsquedas a través de Internet realizadas en enero, lo que supone un incremento del 0,6 por ciento en relación a los resultados del mes anterior (10,7 por ciento del mercado en diciembre).

   Google y Yahoo, por su parte, han visto descendidas sus respectivas cuotas de mercado del 65,7 por ciento al 65,4 en el caso de Google; y del 17,3 por ciento al 17, en el de Yahoo.

   Estos últimos datos resultan especialmente significativos ya que, en total, Google y Yahoo han perdido un 0,6 por ciento de cuota de mercado, cifra que coincide exactamente con el incremento experimentado por Bing. Lo que significa que los clientes que han perdido los dos buscadores líderes han ido a parar directamente a Bing, y no a otros motores de búsqueda que continúan presentando cuotas más pequeñas (Ask Network, un 3,8 por ciento y AOL LLC, un 2,5 por ciento).

martes, 19 de enero de 2010

Que son los Robots o Spiders

Los robots son programas automatizados, y las arañas (spiders ) son un tipo de robots que se desplazan continuamente por la red, saltando de un lugar a otro con el fin de compilar estadísticas sobre el Web o crear bases de datos con el contenido del mismo (Altavista, Lycos, WebCrawler los utilizan).
Las arañas hacen un valioso trabajo para todos; sin ellas sería imposible crear índices actualizados de la red. Pero también tiene sus desventajas: aumentan el tráfico en la red, además de que una araña mal diseñada puede visitar tantas veces a un sitio que impide el acceso a los usuarios. Tampoco pueden discernir sobre páginas permanentes y temporales, a menos que los sitios que visiten sean concientes de los robots.
¿ Cómo funcionan ?
Básicamente, un visualizador es un programa que responde a información introducida por el usuario, enviando comandos HTTP (HyperText Transport Protocol - Protocolo de transporte de hipertexto) a través de internet. Las páginas Web son archivos de HTML que contienen texto, códigos de formato y otros datos que definen su contenido.
Hacer clic en un vínculo ejecuta una serie de acciones:
El visualizador recupera la URL (Uniform Resource Locator - Localizador de recursos uniformes) del destino a la página actual.
Establece una conexión con el servidor remoto, transmite un código Get http para recuperar el archivo HTML y presenta el documento en la pantalla.
Pues bien, un robot Web es un visualizador con piloto automático. En vez del usuario haciendo clics, el robot baja una página del Web y busca vínculos hacia otros sitios, selecciona una URL y salta hacia ella; desde allí, salta a otro sitio Web y comienza todo de nuevo. Cuando llega a páginas sin vínculos, regresa uno o dos niveles, y salta hacia uno de los que omitió la vez anterior.

¿ Qué hacen ?
¿Qué hace un robot con las páginas que visita?. Bueno, depende de la razón para lo cual fue creado. Los robots que hacen índices del Web, utilizan algoritmos para generar resúmenes de documentos que se almacenan en inmensas bases de datos.
Otros robots sirven para identificar los vínculos hacia páginas que ya no existen; otros para llevar estadísticas relacionadas con su uso (sitios más populares, por ejemplo), etc.
¿ Cómo controlar su comportamiento?
Gracias al SRE (Standard for Robot Exclusion - Estándar para la exclusión de robots), protocolo que permitirá a administradores de sitios indicar instrucciones hacia los distintos robots.
Por ejemplo, se puede indicar que no revisen el contenido completo de un sitio, que no trabajen en las páginas en construcción o no ingrese a directorios que no poseen páginas HTML, haciendo además más eficiente y rápido su trabajo.
Para traspasar las instrucciones deseadas a una araña, sólo debe crearse un archivo de texto denominado "robots.txt".
Este archivo de texto contendrá comandos de un sencillo lenguaje indicando las políticas de acceso de un sitio a estos extraños seres del cyberespacio.
¿ Cómo es un archivo robots.txt?
Por ejemplo, a continuación se muestra un archivo sencillo que solicita al robot que se aleje de /dibujos/imagenes y de sus subdirectorios.
# Ejemplo archivo robots.txt
User-agent:*
Disallow: /dibujos/imagenes
La primera línea corresponde a un comentario (#).

La segunda línea indica a que robot se le hace la solicitud; en este caso, la orden es para todos (*).
La tercera línea muestra a que ruta se le quita el acceso, conjuntamente con los directorios que le siguen en orden jerárquico.
Si se desea indicar una orden específica para un robot:
# Ejemplo archivo robots.txt
User-agent:*
Disallow: /dibujos/imagenes
Disallow: /en_construccion
User-agent:Scooter
Disallow:
En el ejemplo, el robot Scooter tiene acceso ilimitado dentro del sitio, pero prohibe a otros a ingresar a las rutas especificadas. [Scooter es el robot de AltaVista].
Si desea prohibir el acceso de cualquier robot a su sitio:
# Ejemplo archivo robots.txt
User-agent: *
Disallow: /

martes, 12 de enero de 2010

Blindsearch, comparando buscadores

Ahora tenemos una página desde donde podemos hacer búsquedas en los tres principales buscadores (Google, Bing y Yahoo) y decidir cual de ellos nos ofrece los resultados que más nos convencen a ciegas. Es decir, primero votamos y luego vemos a cual ha sido nuestro favorito.
Se trata de Blindsearch y ha sido desarrollado por Michael Kordahi.
blindsearch
Hace ya 9 semanas del lanzamiento de Blindsearch y por el momento los resultados preferidos han sido a cargo de: Google: 41%, Bing: 31%, Yahoo: 28%
En el blog personal de Michael Kordahi podemos encontrar más información sobre Blindsearch. Entre otras cosas, curiosos son los comentarios que han ido apareciendo sobre el buscador. Entre ellos la sorpresa de muchos en descubrir que no siempre Google les mostraba el mejor resultados y algunas frases del tipo “OH GOD NO I VOTED FOR BING!!!!”.

lunes, 11 de enero de 2010

Resultados de Busquedas con Insights de Google

Michael Jackson, Sexo, Sudafrica 2010