MISTICA: Estudio de la web española

From: Alvaro Blanco (alvaro_at_funredes.org)
Date: Sun Jun 12 19:02:57 2005


http://www.catedratelefonica.upf.es/

>Estudio de la web española
>
>Se ha realizado el primer estudio masivo del contenido y la estructura de
>la Web española. Para ello, se ha recorrido y recogido su contenido
>textual utilizando "crawlers" como los utilizados en la generación de
>grandes máquinas de búsqueda. Los estudios se han realizado sobre más de
>16 millones de páginas hospedadas en servidores situados en territorio
español.
>
>Se ha analizado la estructura de esa porción de la web y el idioma del
>contenido textual, generando la base para construir corpora del uso en
>Internet de las lenguas del estado español. Se ha caracterizado también
>el "web spam" que se usa con frecuencia en la web española y se ha
>lanzado el concepto de Web Empírica, empezando su explotación.



Este archivo fue generado por hypermail 2.1.3 : Fri Jul 1 11:02:37 2005 AST