El resumen de Victor es bueno pero hay un par de cosas que no son
ciertas. El modelo vectorial puro era lo que usaban los primeros motores de
busqueda pero eso ya no es cierto, ahora es mucho mas complicado. Pero uno
de los puntos centrales del exito de Google es usar la estructura de
enlaces de la Web para hacer ranking (PageRank).
Asi que la verdadera razon de que la respuesta a una consulta en
google.com y google.fr sea distinta, es que la estructura de enlaces de
solo .fr es distinta de .com. Es por eso que entonces la respuesta a
"Victor Sandoval" mejora. Pero no siempre eso ocurre, por ejemplo si buscan
mi nombre en google.com estara mejor ubicado que si solo se busca en las
paginas en castellano. Esto es porque tengo muchos enlaces de paginas que
estan en ingles a mi sitio personal (notese que digo sitio y no pagina! ;-)
Tambien influye lo que las personas consultan, que clicks hacen despues, en
que <tag> de html aparece la palabra, etc. Nadie sabe exactamente, solo
cada motor de busqueda.
Y como los algoritmos son distintos, el universo Web que uno ve en cada
motor es distinto. La metafora que yo uso es que el indice de un buscador
es como el cielo que vemos. Esa imagen no es real pues es luz que viene de
distintas distancias. Algunas cosas no las vemos por que las oculta otro
objeto, etc. Lo mismo en la Web, algunas paginas
no son indexadas, algunas son nuevas, otras no han sido revisadas en un
mes, etc.
Si les interesa el tema lean mi articulo Desenredando la Madeja
http://www.baeza.cl/inf/web.html
(ya esta un poco antiguo pero los conceptos no han cambiado)
La ultima recomendacion de Victor es pertinente. Mientras mas precisa
sea la busqueda (e.g. usar site: para indicar el dominio), mejor la
respuesta. Pero podemos estar perdiendo algo que esta fuera del subconjunto
al que nos hemos restringido.
Saludos
Ricardo
Este archivo fue generado por hypermail 2.1.3 : Tue Jan 4 10:02:49 2005 AST