MISTICA: Re: Consulta sobre recursos

From: Ricardo Baeza-Yates (rbaeza_at_dcc.uchile.cl)
Date: Tue Oct 19 15:47:49 2004


Estimado Ivan:

>Para serte franco, Ricardo, no entiendo la diferenciación que haces: "eso
>numeros de esa pagina no son paginas si no que son sitios completos, pues
>es un directorio de sitios Web (y no paginas)"
>
>En las FAQs de Google dice textualmente, con referencia a este directorio
>de lenguas (exceptuando el Inglés):
>
>>How many web pages are in the directory?
>>The Google directory contains over 1.5 million URLs.

Es un abuso de lenguaje, esos URLs son direcciones de sitios de distinto
tamaño. Por ejemplo Yahoo! tiene mas de 3 millones de URLs en su
directorio.... que son una fracción ínfima de las 4,300 millones de paginas
que tiene Google en su indice. Asi que te insisto, esas son
páginas, pero son además home pages de sitios. Lo correcto es hablar de sitios.

>Por otro lado, en la página de entrada de Google, en la última línea dice
>textualmente:
>>
>>2004 Google - Searching 4,285,199,774 web pages
>
>No sé si prefieres traducir "web pages" por "sitios". Para lo que quiero
>mostrar me es indiferente.

No es indiferente. En la actualidad hay alrededor de 70 millones de
sitios Web en el mundo, los cuales contienen mas de 4,2 mil millones de
páginas. Esto da en promedio 60 páginas por sitio pero como la distribucion
de páginas es una Ley de Zipf (similar a Pareto), más del 80% de los sitios
tiene menos de 60 páginas. Por eso es dificil hacer comparaciones en base a
numeros de sitios y promedios. Para ver ejemplos puedes ver los estudios
que hemos realizado de la Web chilena disponibles en http://www.ciw.cl/ o
http://www.todocl.cl/

>(...) he verificado un factor de crecimiento diverso para cada idioma.
>(...) Quizás se trata de detectar políticas lingüisticas exitosas que
>tienen el efecto de fomentar más la creación de páginas web en un idioma.
>¿O quizás habrá otra razón? En todo caso no hay una relación lineal de ese
>factor de crecimiento con las poblaciones de usuarios en esos idiomas que
>explique esa disparidad.

Estoy de acuerdo contigo en esto ultimo. Estos factores de crecimiento
estan relacionados con factores económicos. Es decir, no es extraño que el
catalan o el japonés crezcan mas que el castellano, frances o swahili. Hay
mas países subdesarrollados en el segundo conjunto.

Saludos
Ric



Este archivo fue generado por hypermail 2.1.3 : Tue Jan 4 10:02:49 2005 AST