LENGUA ESPAÑOLA Y CULTURAS HISPÁNICAS

EN LA INTERNET

Comparación con el inglés y el francés

 

II Congreso Internacional de la Lengua Española
Valladolid
16-19 de octubre de 2001

PANEL: Internet y el español

 

Daniel Pimienta (pimienta@funredes.org)
Benoit Lamey (benoit@funredes.org)
Fundación Redes y Desarrollo – FUNREDES (http://funredes.org)
Versión 1, Agosto de 2001 - Versión final, octubre de 2001

 

RESUMEN

Partiendo de una compilación de trabajos realizados sobre la presencia de la lengua española y las culturas hispánicas en la Internet, los autores describen la situación de la lengua española y de las culturas hispánicas en la red de redes. Ofrecen datos originales sobre la presencia del español en algunos espacios de la Internet (como la web o los grupos de discusión) y establecen un análisis comparativo con otras lenguas, en particular el francés y el inglés. Asimismo, comparan la contribución a la creación de contenidos en español entre España y los demás países de habla hispana lo que permite entrever que España tiene la producción más alta y que la población hispana de EEUU tiene la más baja productividad. La tendencia actual demuestra un crecimiento muy alto del numero de páginas web en español, lo que indica que la lengua española debería tener, en un futuro muy próximo, una presencia en la Internet acorde a su peso en el mundo no virtual. En lo que se refiere a los aspectos culturales, utilizando la metodología de estudios realizados por Funredes en años pasados que consiste en medir el índice de celebridad de personajes representativos de segmentos culturales, los autores miden la evolución de la presencia de las culturas hispánicas y constatan un avance muy importante entre 1998 y 2001. En conclusión, se aboga por una política hispana de promoción de los contenidos en español, que apoye el crecimiento de usuarios de lengua española capacitados y conscientes de las apuestas culturales. Se recomienda también la adhesión a alianzas estratégicas entre las lenguas latinas para llegar a una masa crítica capaz de hacer contrapeso al predominio del inglés.

 

PLAN

RESUMEN
INTRODUCCIÓN
REVISIÓN DE LA LITERATURA
ESTUDIO "LENGUA Y CULTURA LATINAS" DE FUNREDES
METODOLOGÍA DE LA PARTE LENGUA
RESULTADOS POR LENGUAS EN LA WEB
RESULTADOS POR LENGUAS EN USENET
METODOLOGÍA DE LA PARTE CULTURA
RESULTADOS POR CULTURAS
DIFERENCIANDO LOS SEGMENTOS DE LA HISPANIDAD
CONCLUSIONES
FUENTES, REFERENCIAS Y BIBLIOGRAFIA

 

INTRODUCCIÓN

El español es la cuarta lengua mas hablada en el planeta, después del chino, el inglés y el hindi. Además de esto, tiene la ventaja de ser la lengua común a la mayoría de los países de un continente y de ser la segunda lengua de los Estados Unidos, con un crecimiento acelerado.

Por otro lado, muchos de los desafíos económicos y culturales de la nueva sociedad que se está formando en este nuevo siglo se expresan en el seno de la Internet, un espacio cuyo número total de usuarios1 alcanza hoy un nivel comparable con el número de hablantes de las lenguas más poderosas, aunque con unas desigualdades drásticas en lo que se refiere a la repartición entre ricos y pobres.

En este contexto, es importante entender cuál es la presencia de la lengua española en la Internet, determinar cuáles son las tendencias y las perspectivas, y tratar de establecer la forma de incidir, con políticas apropiadas, en dicha presencia, que es a la vez testigo y motor del peso económico y/o cultural.

Dentro de las lenguas dominantes, una tiene una estatura muy particular en el mundo virtual, el inglés, que trae consigo un historial de predominio absoluto y una tendencia por parte de los medios de comunicación y de sus agentes que consiste en tomar este hecho como algo irreversible, a pesar de las evoluciones recientes que muestran una difusión cada vez más amplia de Internet en todas las comunidades lingüísticas. Otra lengua, el francés, pese a representar un peso global menor, comparte con el español —al igual que con el inglés y el portugués— la particularidad de ser la lengua oficial de uno de los países industrializados y de estar presente, además, en varios otros países del planeta, sean estos del sur o del norte.

Nuestro análisis describirá la presencia del español en la Internet y tratará de establecer comparaciones con el inglés y el francés, particularmente con este último ya que presenta el interés de contar con el apoyo de una política firme por parte de varias agencias2, la cual incluye varias acciones específicas orientadas hacia el mundo virtual3.

 

REVISIÓN DE LA LITERATURA

Sigue una compilación sintética y crítica de lo que se ha escrito sobre el tema.

Reflexiones generales sobre las informaciones disponible en la Internet

Cualquier persona puede dar su opinión en la Internet, pero cuando se trata de medir o de escribir sobre el multilingüismo, el número de autores es limitado. Para simplificar, se puede establecer tres grupos.

Las consultoras especializadas en mercadeo que realizaron mediciones (en general a partir de sondeos) y produjeron cifras brutas (números de páginas por idioma, de servidores por dominio, de usuarios por país...). De manera general, las interpretaciones de estos resultados son limitadas; el enfoque principal se centra en los resultados y en la imagen de la empresa que hizo el estudio (en muchos casos la publicación del estudio es de hecho una operación de promoción de la empresa). A diferencia de las costumbres académicas, los resultados obtenidos no están comparados con los de otras consultoras y en la gran mayoría de los casos, la metodología no está expuesta (o sólo parcialmente).

A pesar de esta carencia de datos fiables, el grupo de lingüistas profesionales o estudiantes logra realizar estudios. Cuando los autores no son especialistas de las nuevas tecnologías suelen presentarse definiciones ambiguas y/o mezclas de conceptos (por ejemplo, no se sabe si los datos se refieren a tráfico o a páginas web) pero en general las conclusiones son bastante homogéneas aunque diversas.

Finalmente, un tercer grupo, compuesto por periodistas o expertos en políticas públicas, se sirve de las publicaciones precedentes a fin de producir documentos de referencia para ser utilizados en acciones gubernamentales o en anuncios a la prensa. En algunos casos, especialmente cuando la prensa trata el tema, aparecen cifras nuevas sin que se conozca la fuente, o peor aún, cifras referenciadas ... pero distintas de la fuente citada!

Es una paradoja que debería llevar a la reflexión el hecho de que en la Internet, espacio de predilección para la información (y en fin, la prolongación de lo que eran las redes académicas), se pueda tratar a veces un tema tan serio con métodos tan poco científicos!

 

Español y francés, destino común

Es interesante (y finalmente lógico) ver cómo los textos sobre el francés y el español en la Internet son parecidos en varios aspectos.

Fuerte presencia en el mundo no virtual
De manera general, los autores insisten sobre el hecho de que su lengua (el español o el francés, según el caso) es de mucha importancia tanto históricamente como en cantidad de locutores (locutores presentes en un país fuente y repartidos en varios otros países del planeta, del Norte como del Sur, incluyendo América del Norte). El pasado colonial de España y Francia da la explicación de esta situación y es indirectamente la razón de la presencia del español y del francés, en Estados Unidos y Canadá, respectivamente.

Inicios lentos en el mundo virtual
Tanto los países de Europa como los países en desarrollo fueron lentos en invertir en el mundo virtual. Hay dos razones principales: el precio elevado de conexión y el rechazo natural de un medio de comunicación percibido como dominado por Estados Unidos. El primer uso masivo de la Internet por parte de los franco e hispanohablantes se ha hecho naturalmente en América del Norte. ¡Se encuentran todavía textos en la Internet que afirman, que hay más cibernautas de lengua española en Estados Unidos que en el resto del mundo! Eso ya no es cierto; sin embargo, este hecho histórico puede tener todavía un peso fuerte sobre la situación actual: Los usuarios estadounidenses, cualquier sea su idioma materno, están sumergidos en un espacio económico y cultural marcado por el inglés.

Retos para el mundo virtual
Muchos autores insisten sobre los problemas técnicos que impidieron el desarrollo de la Internet multilingüe, como el no tratamiento de los diacríticos por el código ASCII, lo que ha representado un obstáculo para la indexación de páginas en español o francés. Otros insisten sobre la importancia de las herramientas de traducción automática que abre puentes entre espacios lingüísticos.

Un gran potencial de desarrollo
De acuerdo con la gran mayoría de los que escriben sobre el tema, el francés y el español toman cada vez más espacio en la Internet. El mundo francófono está bastante satisfecho de este crecimiento (sostenido por un fuerte apoyo inter gubernamental) que da al francés un peso más importante en el mundo virtual que en el mundo real. La mayoría de las estadísticas revelan que el español tiene ahora un poco más de páginas web que el francés; no obstante, dado el número de locutores mucho más elevado, su presencia relativa en el mundo virtual es débil y es entonces un tema de preocupación.

Medidas tomadas o propuestas para mejorar el peso del mundo latino en la Internet
Una vez más, los textos en español y en francés tienen recomendaciones similares para mejorar la presencia en la Internet. Se refieren a la necesidad de una voluntad de los gobiernos, de la sociedad civil y de los organismos lingüísticos de referencia. Mencionan el requerimiento para una mejora de las herramientas de traducción y de acceso a la información en cada idioma, así como la creación de motores de búsqueda y de portales en cada idioma. Por cierto hay también recomendaciones de crear sitios de comercio electrónico multilingües, pero las sugerencias de políticas se orientan con más fuerza hacia el espacio público. ¿La Internet latina sería más ciudadana que su hermana estadounidense?

Aspectos específicos a los mundos franco e hispanohablantes

El mundo francófono
Una razón específica en el caso de Francia de sus inicios lentos, fue la presencia de un sistema telemático exitoso (el Minitel) que pudo competir por un tiempo con la Internet4, pero con un alcance y mercado limitado a Francia. El mundo francófono, siguiendo una vieja tradición de defensa de la lengua, realizó esfuerzos intergubernamentales consecuentes en pro del desarrollo del francés en la Internet, y hoy en día parece haber logrado algunos resultados.

El mundo hispanohablante
Una particularidad del español es la variedad de formas en la que se puede escribir. Muchos autores insisten en la necesidad de estandardización del idioma para permitir el desarrollo de herramientas lingüísticas (traductores entre otros) que se puedan distribuir mundialmente. Si bien hay acciones en España (Instituto Cervantes) y a nivel internacional (OEI), no se ha determinado aún una política mundial para apoyar la presencia del español en la Internet.

En marzo de 2001, bajo el patrocinio de las organizaciones internacionales que representan los espacios lingüísticos español, francés y portugués, se realizó el coloquio "Tres espacios lingüísticos ante los desafíos de la mundialización" y se elaboraron varias propuestas de alianzas multilingües (para los contenidos, para las comunidades virtuales, para la universidad virtual...). No cabe duda que esa es una dirección capaz de cambiar el balance de las fuerzas. Ojalá se concreten rápidamente las políticas concertadas...

ESTUDIO "LENGUA Y CULTURA LATINAS" DE FUNREDES

La Fundación Redes y Desarrollo (FUNREDES) sostiene una visión de la Internet en pro del desarrollo que incluye la defensa de la diversidad de las culturas y las lenguas en el ciberespacio. Dentro de este marco y para lograr matizar los planteamientos simplistas y pesimistas acerca de la absoluta e irresistible predominancia del inglés dentro de la red de redes, Funredes ha desarrollado, a partir de 19965, algunos métodos y procedimientos para medir la presencia de las lenguas latinas6 en comparación con el inglés. Desde 1998, con la colaboración de la Unión Latina en lo que se refiere a la parte lingüística de la metodología, la calidad y fiabilidad de los resultados es notable, tal y como lo reflejan los cálculos estadísticos realizados a partir de las mediciones.

Inicialmente, el estudio se centró en dos segmentos, en lo referido a la parte lingüística:

el espacio de las páginas web y el espacio de las páginas de grupos de discusión (Usenet), ofreciendo además una aproximación metodológica en cuanto a la parte cultural.

El trabajo sobre el aspecto cultural fue realizado nuevamente en 1998 y a partir de 1999 las medidas se tomaron solamente con relación a la presencia de las lenguas latinas en el espacio web. A partir de agosto del 2000, Funredes consiguió automatizar las campañas de medición y con esto desarrollar un plan de observación sistemática, con una frecuencia de producción de cifras de dos meses, lo cual permite percibir las evoluciones de forma más afinada. En ocasión del Congreso de Valladolid, Funredes realizó una tercera serie de medidas sobre el aspecto cultural, en octubre de 2001.

METODOLOGÍA DE LA PARTE LENGUA

El método utilizado consiste, en primer lugar, en establecer una selección de términos por lengua, cada uno con sus respectivas variantes ortográficas, con y sin el uso de los signos diacríticos, así como las variantes sinonímicas, dialectales y morfosintácticas, y respetando un significado y alcance equivalentes en todas las lenguas estudiadas. A continuación, para cada término, se mide el número de páginas web que lo contiene, utilizando uno de los motores de búsqueda que responda a los criterios del método. Seguidamente, se analizan y comparan los resultados para deducir estadísticamente porcentajes de presencia de cada idioma. Para cada término, la relación de las lenguas latinas con respecto al inglés es utilizada como variable aleatoria y se aplican técnicas estadísticas tomando como hipótesis una distribución matemática corriente de esta variable aleatoria. Todo aquel que esté interesado en conocer los detalles de la metodología puede consultar las páginas http://funredes.org/LC, en las cuales la misma está plenamente documentada.

RESULTADOS POR LENGUAS EN LA WEB

Los últimos resultados acerca de la presencia de las lenguas latinas en comparación con el inglés en el espacio web son los siguientes (Agosto de 2001):

PORCENTAJE DE PÁGINAS WEB

INGLÉS

50,00%

ESPAÑOL

5,62%

FRANCÉS

4,57%

ITALIANO

3,08%

PORTUGUÉS

2,79%

RUMANO

0,18%

RESTO

33,78%

El gráfico siguiente muestra la progresión registrada desde que se iniciaron las mediciones, cuya fiabilidad es limitada en lo que se refiere a las medidas anteriores a 1998 y cuya frecuencia es más alta a partir de agosto del 2000.

 

és tenía la En el mismo periodo, el inglés tenía la siguiente evolución:

FECHA

9/1998

8/2000

1/2001

6/2001

8/2001

PORCENTAJE DE PAGINAS WEB EN INGLES

75%

60%

55%

52%

50%

La progresión del español en los últimos meses es impresionante y la tendencia al alza acelerada se mantiene. Sin embargo, los valores de presencia absoluta no son un indicador perfecto del vigor de un idioma en la Red. Para obtener un resultado significativo, conviene proporcionar valores que expresen la presencia de las lenguas en la Internet según su presencia en el mundo real. Partamos de una estimación de las personas que utilizan un idioma como primera o segunda lengua (fuente: Unión Latina).

Cifras redondeadas en millones

 

Inglés

Español

Portugués

Francés

Italiano

Rumano

Presencia absoluta (nº de hablantes)

630

375

190

130

60

30

Presencia relativa

(% mundial)

10,50%

 

6,25%

 

3,17%

 

2,17%

 

1%

 

0,50%

 

Si dividimos el porcentaje de páginas web por el de la presencia relativa, el resultado, normado a 17, indica el vigor de cada lengua estimado como la presencia ponderada de las lenguas estudiadas en el espacio WWW.

 

 

Presencia absoluta 8/2001

Presencia ponderada 8/1998

Presencia ponderada 8/2001

Evolución

3 años

INGLÉS

50,00%

7,14

4,76

- 33,31%

ESPAÑOL

5,62%

0,40

0,90

+ 124,80%

FRANCÉS

4,57%

1,30

2,10

+ 61,82%

ITALIANO

3,08%

1,50

3,08

+ 105,00%

PORTUGUÉS

2,79%

0,26

0,88

+ 237,90%

RUMANO

0,18%

0,30

0,35

+ 16,67%

 

Se puede observar una debilidad del español (y aún más del portugués) en el periodo inicial de medición, una buena posición del francés y una posición excelente del italiano y del inglés. También se comprueba una fuerte progresión del español, que tiende, de manera acelerada, a equilibrar su posición. El hecho que la presencia ponderada sea todavía inferior a 1 deja entrever el mantenimiento de la tendencia al alza en lo que se refiere al español. La posición del inglés tiende a disminuir aunque queda claro en el valor ponderado el fenómeno de predominancia. El francés ha podido cosechar los frutos de una política voluntaria y ahora podría ir reduciendo su aumento relativo.

¿Cuál es el factor dominante en la presencia de páginas web con respecto a un idioma? Para saberlo, comparemos el número estimado de internautas por lenguas con nuestras cifras. Partamos del número de internautas registrados por lenguas (fuente GlobalReach):

 

Inglés

Español

Portugués

Francés

Italiano

Rumano

Resto

Internautas

(en millones)

217,8

20,4

12,1

16,6

17,5

0,6

191

Distribución

(en %)

45,76%

4,29%

2,54%

3,49%

3,68%

0,13%

40,13%

 

Si dividimos nuestros porcentajes de páginas web por lengua por las cifras del cuadro anterior logramos el siguiente índice de la productividad de páginas web por lenguas:

P=Páginas

I=Internautas

P/I =

INGLÉS

50,00%

45,76%

1,09

ESPAÑOL

5,62%

4,29%

1,31

FRANCÉS

4,57%

3,49%

1,31

ITALIANO

3,08%

3,68%

0,88

PORTUGUÉS

2,79%

2,54%

1,10

RUMANO

0,18%

0,13%

1,39

El resultado es sorprendente: las proporciones por lengua de las páginas en la Red y de internautas… ¡son de dimensión semejante! La relación entre porcentaje de páginas y porcentaje de usuarios se sitúa alrededor de 1 para todas las lenguas estudiadas8, lo que mostraría que la cantidad de páginas de la Red producidas en un idioma es hoy directamente proporcional a la cantidad de internautas hablantes de ese idioma. El resultado del inglés, en cambio, es llamativo ya que se hubiera podido esperar un valor mucho mayor, por influencia del plurilingüismo9. Esto podría significar que la productividad de los anglófonos es inferior a la de los hablantes de las otras lenguas estudiadas. ¿Prueba esto un aumento de la producción por parte de los hablantes de otras lenguas occidentales, conscientes de los desafíos lingüísticos de Internet? Sería interesante conocer los valores respectivos en las lenguas de introducción más recientes en la Internet.

 

RESULTADOS POR LENGUAS EN USENET

Este resultado muestra la vitalidad de los idiomas en los espacios de discusión de la Internet (llamados también "newsgroup").

 

Sep-1998

Sep-2001

evolución

Presencia

absoluta

Presencia

Ponderada

Presencia

Absoluta

Presencia

ponderada

inglés

80,00%

7,62

75,00%

7,14

-6,25%

español

1,93%

0,31

1,39%

0,22

-27,88%

francés

1,15%

0,53

2,66%

1,23

131,65%

italiano

2,03%

2,03

3,22%

3,22

58,42%

portugués

0,90%

0,28

0,26%

0,08

-71,33%

rumano

0,11%

0,23

0,08%

0,16

-23,64%

resto

13,88%

0,18

17,39%

0,23

25,29%

El resultado de 1998 era coherente. El decrecimiento de las cifras correspondiente al español y al portugués entre 1998 y 2001 le elimina sin embargo credibilidad a este nuevo resultado. En 1998, como en 2001, se usó la base de datos de Dejanews para este estudio; sin embargo, en 2001, Dejanews ha sido comprado por la compañía Google la cual aplica su propios motores a este base de datos. Detectamos incoherencias graves en la búsqueda por fecha que hicieron imposible restablecer las cifras del 1998 con ese nuevo motor10. Esta situación alerta sobre un análisis cuidadoso de la función de búsqueda en Usenet de Google y lamentablemente no permite, en este momento, sacar conclusiones para nuestro estudio.

 

METODOLOGÍA DE LA PARTE CULTURA

¿Cómo medir la representación de una cultura en la Internet? Es ciertamente una cuestión muy difícil y no existe un método que garantice escaparle a la subjetividad y/o a la aproximación. Hemos adoptado una metodología muy sencilla, inspirada en la medida del valor de apreciación de un científico: el índice de citación. Hemos establecido un número limitado de categorías significativas de un aspecto de la cultura. Para cada categoría establecida hemos listado un número alto11 (aunque no exhaustivo) de personalidades representativas de la cultura en cada grupo lingüístico. Luego hemos medido la celebridad de cada personaje en la Internet, utilizando el número de citaciones en las páginas web, dato que ofrecen algunos motores de búsqueda.

Las categorías establecidas son las siguientes:

En este estudio no se ha tratado de tomar el conjunto de personalidades célebres que aparecen en una enciclopedia o todos los nombres propios de un diccionario sino más sencillamente de establecer una muestra suficientemente variada y representativa como para permitir estimar, subjetivamente, si las culturas latinas y la estadounidense están presentes de manera relativamente equilibrada en las páginas web. No hay, por cierto, una única cultura francófona, hispanohablante o lusófona pues no es posible identificar a una nación con una sola cultura y viceversa. En la medida en que estas culturas se identifican con la lengua oficial de las naciones respectivas, la frontera entre lengua y cultura es difícil de establecer. Por tanto, conviene no perder de vista el carácter al mismo tiempo subjetivo y arbitrario de la metodología elegida. En ningún caso hay que tomar estos resultados como una medición real del peso de las diferentes culturas en Internet. A diferencia de la parte lingüística, cuyos resultados han sido cuantificados y son fiables, se trata aquí de una mera aproximación subjetiva para esquematizar tendencias.

A pesar de estos límites, los resultados aportan una buena estimación de la situación en el espacio web con respecto a la proyección de las distintas culturas. Así mismo, la evolución de los resultados entre 1998 y 2001, es coherente con los resultados del estudio sobre la parte lingüística, da credibilidad y confianza en el método. Sin embargo, en el futuro será indispensable elaborar nuevas metodologías que puedan escapar al análisis exclusivamente cuantitativo, lo cual es claramente una limitación para ser aplicada a la temática cultural, donde el aspecto cualitativo debería prevalecer.

 

RESULTADOS POR CULTURAS

Se realizó el estudio cultural en 1996, 1998 y 2001, con un esfuerzo de extensión y de mejora de la selección de personajes representativos en 1998 y con una automatización del proceso de medida en 2001, requerimiento para poder lograr un observatorio permanente de las culturas latinas en la Internet.

Se definió un método de ponderación de los resultados que permite normalizar (las notas van de 0 a 10012) y sintetizar los resultados. Este método tiende a favorecer los primeros citados y no es no es muy sensible a variaciones leves repartidas de manera homogéneas.

La tabla siguiente indica los valores de 1998 y, entre paréntesis, la evolución entre 1998 y 2001:

 

de EEUU

española

francesa

italiana

portuguesa

rumana

otras

CIENCIAS

25 (-3)

4

21 (+2)

11 (-1)

 

4

60 (-8)

LETRAS

38 (-3)

7

16 (+3)

4

4 (+1)

2 (+1)

60 (+2)13

CINE

88 (-12)

4

6

4

2 (-1)

2

18 (+5)14

ARTES

9

44 (-4)

28 (+3)

12

6 (-1)

4

18 (-2)15

MÚSICA

46 (+4)

9 (+2)

6

6

5

1 (-1)

60 (-8)16

POLÍTICOS

93 (-7)

11 (+3)

11

6 (+1)

4 (-1)

4

32 (+7)

MEDIA

71 (+6)

8

15 (+1)

9 (-1)

6

6

39 (-7)

HISTÓRICOS

65 (-10)

10

15 (+1)

17 (-1)

4 (-1)

 

34 (+3)

IMAGINARIOS

42 (+3)

14

16 (-3)

17 (+2)

9

11

37 (+14)

TODAS CATEGORÍAS

75 (+4)

5 (+3)

4 (-1)

3

1

0

30 (-1)

Los personajes latinos quedan bien representados en los sectores culturales en donde la separación entre comercio y cultura está más marcada. Pero cuando se trata de sectores culturales regidos por las leyes del mercado, la cultura estadounidense se impone. Según esta misma lógica, las personalidades latinas que lograron penetrar en el mercado estadounidense (por ejemplo, Ricky Martín o Céline Dion en la canción y Antonio Banderas en el cine) aparecen en una posición muy superior a la de sus homólogos culturales.

Entre 1996 y 1998 se pudo notar un aumento general de la presencia de las culturas latinas, medido en términos del total de paginas citadas, de 11,25% en 3 años. Esta vez esperábamos un crecimiento mayor, especialmente para las culturas hispánicas y los resultados confirman nuestras previsiones como lo muestra la tabla siguiente:

Evolución del número de paginas citadas por categoría y espacio (1998-2001)

 

EEUU

ES

FR

PO

IT

RU

Resto

TOTAL

Ciencias

375%

786%

528%

405%

661%

416%

426%

Letras

417%

571%

539%

721%

539%

466%

471%

483%

Cine

422%

640%

534%

532%

506%

502%

547%

455%

Música

487%

954%

508%

717%

590%

630%

411%

487%

Arte

406%

541%

592%

564%

482%

448%

549%

519%

Política

334%

617%

411%

478%

753%

580%

510%

407%

Mediáticas

434%

622%

679%

462%

476%

726%

429%

452%

Históricos

290%

433%

422%

72%

473%

354%

344%

Imaginarios

227%

585%

241%

468%

296%

240%

290%

264%

General

299%

537%

425%

452%

446%

458%

358%

352%

Vs. promedio

-15,06%

52,56%

20,74%

28,41%

26,70%

30,11%

1,70%

0,00%

Vs. EEUU

0,00%

79,60%

42,14%

51,17%

49,16%

53,18%

19,73%

17,73%

La culturas latinas aumentan en promedio cerca de 55% en relación las culturas estadounidenses entre 1998 y 2001 y las culturas hispánicas aumentan cerca de 80%, un resultado especialmente notable en "música" y "personajes imaginarios". El análisis de la tabla permite ver que las categorías "arte", "música" y "letras" son, en general, las que conocen el progreso más notable, contribuyendo a la mejora de la posición de las culturas latinas.

Es interesante observar que el resultado excepcional de las culturas hispanas en la categoría "artes plásticas" había sido logrado desde el primer estudio en 1996.

Un análisis detallado de los resultados, los cuales se pueden consultar en http://funredes.org/LC/, permite observar algunos fenómenos curiosos, relevantes de la sociología global. Así Jean Paul Sartre y Albert Camus quienes están muy próximos aparecen ahora en este orden y notamos que las progresiones mas fuertes entre 1998 y 2001 han sido la de Carlos Santana, Roberto Carlos, Celia Cruz, Carlos Gardel y Caetano Veloso. Al dejar la Presidencia de Estados Unidos, Bill Clinton, quien ocupaba el primer lugar de todas las categorías, deja este espacio a Jesucristo.

Los diez personajes más citados correspondientes a la cultura hispana, incluyendo todas las categorías y en orden de citación, en una palabra (la cifra entre paréntesis indica la progresión en términos de clasificación desde el ultimo estudio en 1998):

Dalí (+39), Picasso (-9), Cervantes (+24), Zapata (+18), Bolívar (-44), Goya (-8), Guevara (+2), Fujimori (+21), Quijote (+19) y Neruda (-3). No hay cambio en comparación con el resultado de 1998.

Igual, en dos palabras:
Ricky Martín (+265), Fidel Castro (+29), Don Juan (+10), Salvador Dalí (+27), Pablo Picasso (+39), Antonio Banderas (+46), Che Guevara (+8), Augusto Pinochet (+286), Simón Bolívar (+2), Gloria Estefan (+2) y Carlos Santana (+645).
Estaban en 1998 y salieron en 2001: Alberto Fujimori (+8), Villa Lobos (-6) y Pablo Neruda (+4).

Los diez personajes más citados con respecto a todas las culturas latinas, en la categoría "ciencias":
Pierre o Marie Curie (+9), Louis Pasteur (+0), Blaise Pascal (-1), Galileo Galilei (-1), Enrico Fermi (-2), Jacques Cousteau (+0), Guglielmo Marconi (+1), Claude Lévi Strauss (+2), Jaques Monod (+0), Joël de Rosnay (+2).
Sale Benoit Mandelbrot (-8).

Igual, en la categoría "letras":
Víctor Hugo (+1), Jules Verne (+3), Dante Alighieri (+6), Jean Paul Sartre (+11), Antoine de St Exupery (+43), René Descartes (+0), Albert Camus (+4), Pablo Neruda (+2), Gabriel García Márquez (+2) y Alexandre Dumas (+1).
Sale Jean Jaques Rousseau (-3) para dejar el espacio a St Exupery.

En la categoría "cine":
Antonio Banderas (+10), Juliette Binoche (+10), Gérard Depardieu (+6), Luc Besson(-4), Catherine Deneuve (+9), Pedro Almodóvar (+20), Brigitte Bardot (+1), Jean Reno (+7), Jean luc Godard (+1) y Federico Fellini (-6).
Sale François Truffaut (-1)

En la categoría "música":
Ricky Martín (+39), Céline Dion (-2), Roberto Carlos (+16), Gloria Estefan (-2), Carlos Santana (+109), Guiseppe Verdi (+1), Villa Lobos (-4), Caetano Veloso (+14), Julio Iglesias (+8) y Luciano Pavarotti (-3).
Salen Tito Puente (-4) y Antonio Vivaldi (+0).

En la categoría "artes":
Leonardo da Vinci (+0), Salvador Dalí (+0), Pablo Picasso (+0), Claude Monet (+0), El Greco (+1), Marc Chagall (+4), Diego Rivera (-2), Frida Kahlo (-2), Henri Matisse (+1) y Paul Gauguin (+4).
Sale Joan Miro (-8).

En la categoría "política":
Fidel Castro (+6), Fernando Cardoso (+10), Jaques Chirac (-1), Charles de Gaulle (-7), Lionel Jospin (+17), Che Guevara (+2), Augusto Pinochet (+39), Romano Prodi (+15), Silvio Berlusconi (+29) y Alberto Fujimori (+1).
Salen Georges Pompidou (-6), Getúlio Vargas (-1) y François Mitterrand (-7)

En la categoría "mediáticas":
Ayrton Senna (+1), Christian Dior (+1), Giorgio Armani (+1), Zinédine Zidane (+6), Ives St Laurent (+2), Jean Paul Gaultier (+0), Diego Maradona (+3), Oscar de la Renta (-2), Coco Chanel (+3) y Richard Virenque (-2).
Salen Alberto Tomba (-14) y Federico Mayor (-3).

En la categoría "históricos":
Julius Cesar (+4), Marco Polo (+1), Louis XIV (+2), Simón Bolívar (+1), Paolo VI (+4), Vincent de Paul (-2), Giovanni XXIII (+4), Marie Antoinette (+9), Napoléon Bonaparte (+5) y Cristóbal Colón (+8).
Salen Vasco de Gama (-28) y Louis XVI (-2).

En la categoría "imaginarios":
Dracula (+0), Casanova (+3), Asterix (-2), Don Juan (+3), Pinocchio (+0), Tintin (-4), Lucky Luke (+4), Don Quijote (+2), Arlecchino (-1), Mafalda (+4).
Sale Gargantua (-4).

Finalmente, las personalidades más citadas con respecto a todas las lenguas latinas, incluyendo todas las categorías:
Leonardo Da Vinci (+0), Ricky Martín (+265), Céline Dion (-2), Fidel Castro (+29), Julius Cesar (+35), Marco Polo (+17), Don Juan (+10), Víctor Hugo (+2), Fernando Cardoso (+73) y Jaques Chirac (-3).
Salen Charles de Gaulle (-37) y Louis XIV (-2)

 

DIFERENCIANDO LOS SEGMENTOS DE LA HISPANIDAD

En preparación al Segundo Congreso Internacional de la Lengua Española, Funredes ha realizado nuevas medidas, que permiten afinar el diagnostico de la situación de la lengua española en la Internet, con la intención de facilitar insumos para responsables de políticas publicas. El objetivo es tener una información mas detallada sobre las fuentes de producción de contenidos en español. La metodología consiste en repetir las medidas del estudio lengua con el mismo grupo de palabras dentro de cada dominio Internet relevante y luego deducir la producción por país.

Las medidas en relación con la repartición de las paginas web en español, por dominio Internet de país (se lee así: "13.48% de las paginas en español de la Internet proceden del dominio .es") produjeron los resultados siguientes:

País

Dominio

Nacional

Proporción de páginas en español

Dominio genérico

Argentina

.ar

9,06%

.com

35,23%

Bolivia

.bo

0,14%

.org

11,73%

Brasil17

.br

0,83%

.net

4,23%

Chile

.cl

3,29%

.gov

0,14%

Colombia

.co

1,96%

.edu

1,78%

Costa Rica

.cr

0,51%

 

 

Cuba

.cu

0,55%

Dominicana

.do

0,20%

Ecuador

.ec

0,35%

El Salvador

.sv

0,19%

España

.es

13,48%

Estados Unidos

.us

0,10%

Guatemala

.gt

0,20%

Honduras

.hn

0,10%

México

.mx

8,14%

Panamá

.pa

0,21%

Paraguay

.py

0,29%

 

Perú

.pe

1,27%

Puerto Rico

.pr

0,02%

Uruguay

.uy

0,96%

Venezuela

.ve

1,14%

Otros países

3,37%

TOTAL

 

46,89%

53,11%

Para establecer el peso total de cada país en la producción de contenidos en español, se requiere proseguir y repartir los porcentajes de dominios genéricos entre esos países (o sea, repartir entre los diferente países, los 53,11% de paginas web en español que están en dominios genéricos). Es una tarea muy difícil pues está directamente relacionada con la proporción, en cada país, del numero de sitios web que no hacen uso del dominio nacional, valor variable según los países y por el cual no existen datos seguros.

Agradecemos la contribución de varios colegas expertos en el tema18 con quien conjuntamente establecimos unas hipótesis de trabajo para una aproximación de esta situación, a partir de los datos disponibles cuando fue posible (las cifras resaltadas de la próxima tabla son las que están mejor sustentadas con datos) o a partir de nuestro mejor juicio en el caso contrario.

En regla general, una buena política de gestión de dominio nacional (como en Chile) con un precio bajo de los dominios genéricos (como es el caso extremo de Argentina donde los sub-dominios son gratis) favorece la ubicación de sitios web bajo el dominio nacional, y una gestión con problemas (como en Haití) o precios altos (como en Colombia) provoca la ubicación de los sitios web en el exterior (a menudo en EEUU). Cabe señalar la situación de España en donde se estima que sólo 25% de los sitios web utilizan el dominio .es, consecuencia de una política muy estricta en cuanto al nombre de dominios establecida para evitar conflictos con nombres de marca.

Estableciendo un valor en cada país para la proporción de sitios web que no están bajo el dominio nacional se puede entonces lograr una aproximación de la proporción de páginas en español producida en cada país19:

 

Proporción de páginas en español bajo dominio nacional

Hipótesis sobre la proporción de sitios web bajo dominio nacional

Porcentaje de contribución, por país, a la producción de paginas en español

Argentina

9,06%

95%

9,54%

Bolivia

0,14%

80%

0,18%

Brasil

0,83%

90%

0,92%

Chile

3,29%

90%

3,66%

Colombia

1,96%

50%

3,92%

Costa Rica

0,51%

80%

0,64%

Cuba

0,55%

95%

0,58%

Dominicana

0,20%

50%

0,40%

Ecuador

0,35%

80%

0,44%

El Salvador

0,19%

80%

0,24%

España

13,48%

25%20

53,92%

Estados Unidos

0,10%

2%21

5,00%

Guatemala

0,20%

80%

0,25%

Honduras

0,10%

80%

0,13%

México

8,14%

95%

8,57%

Nicaragua

0,53%

80%

0,66%

Panamá

0,21%

80%

0,26%

Paraguay

0,29%

80%

0,36%

Perú

1,27%

90%

1,41%

Puerto Rico

0,02%

10%

0,20%

Uruguay

0,96%

80%

1,20%

Venezuela

1,14%

80%

1,43%

Otros Países

3,37%

55%

6,13%

TOTAL

46,89%

 

100%

Este método de cálculo permite establecer que mas de la mitad de las paginas en español en la Internet están producidas en España, a pesar de contar ese país con solo el 20%22 de los usuarios hispanohablantes de la Internet. Los países que contribuyen más notablemente a la producción de contenidos en español son, después de España, y por orden: Argentina (9,5%), México (8,6%), Estados Unidos (5%), Colombia (3,9%) y Chile (3,7%). La proporción de contribución a la producción de contenidos en español por región es la siguiente:

España : 54%
América latina y Caribe : 35%
Estados Unidos: 5%
Resto del mundo: 6%

El método de cálculo es válido, sin embargo, esta primera aproximación es poco precisa dada la dificultad de tener valores seguros para la proporción de páginas bajo dominio nacional. Consideramos que los valores logrados están dentro de una media de más o menos 25% y a medida que se vayan definiendo los datos requeridos podremos, utilizar la misma tabla e ir afinando el resultado.

La parte mas cuestionable del resultado es la de la contribución de EEUU a los contenidos en español pues estamos extrapolando a partir de las medidas de un dominio nacional con uso sumamente limitado y entonces queda una gran sensibilidad a la hipótesis (por ejemplo si ponemos 4% en vez de 2% de sitios web bajo el dominio nacional el resultado para EEUU pasa a la mitad, 2.5% en vez de 5%).

Estados Unidos cuenta con más del doble de usuarios de lengua española que España pero la producción asociada no parece estar a la altura de la cifra. Según nuestro resultado el factor de productividad de EEUU es 22 veces inferior al de España.. La tentación es grande de añadir una tabla mostrando, por país, el cociente del porcentaje de contribución a la producción en español por el porcentaje de usuarios de lengua española. Así tendríamos una cifra de la productividad por país.

El problema es que los datos disponibles (Global Reach) para el número de usuarios hispanohablantes por país no son ni muy confiables ni homogéneos. Por esta razón entonces, es difícil determinar si una cifra baja de productividad es el reflejo de la realidad o más bien la consecuencia de una sobre-estimación del número de usuarios (y recíprocamente para una cifra alta).

A continuación mostramos algunos elementos de esta tabla.

Contribución a la producción de paginas en español

Numero de usuarios

(millones)

Porcentaje del total de usuarios hispanohablantes

PRODUCTIVIDAD

para contenidos en español

Argentina

9,54%

2,5

7,18%

1,33

Chile

3,66%

0,63

1,81%

2,02

Colombia

3,92%

0,6

1,72%

2,27

Costa Rica

0,64%

0,15

0,43%

1,48

Cuba

0,58%

0,06

0,17%

3,36

España

53,92%

7

20,11%

2,68

Estados Unidos

5,00%

15

43,08%

0,12

México

8,57%

6,7

19,24%

0,45

Perú

1,41%

0,4

1,15%

1,23

Puerto Rico

0,20%

0,2

0,57%

0,35

Uruguay

1,20%

0,3

0,86%

1,39

Venezuela

1,43%

0,95

2,73%

0,52

Cuba aparece como el país mas productivo antes de España. Probablemente se unen en este caso los dos factores: una sub-estimación del número de usuarios en Cuba y una política de Estado que favorece la producción de contenidos. No sorprenden las cifras muy bajas de Estados Unidos y Puerto Rico; pero llama la atención el resultado de México. ¿Será la cifra de usuarios muy exagerada o será la vecindad con EEUU que da un incentivo a producir en inglés?

Quedan, por supuesto, páginas escritas en español en países en donde no se habla español y en sitios donde el multilinguïsmo es un factor importante: según nuestro cálculo este rumbo representa un poco más del 6% del total de los contenidos en español.

 

CONCLUSIONES

Aunque el inglés siga teniendo predominio en la Internet, éste se está reduciendo progresivamente. En el espacio web, el porcentaje de páginas en inglés está pasando por debajo del umbral del 50%, lo cual contradice el discurso dominante que considera el predominio del inglés como un hecho irreversible y cantidades de referencias que persisten a atribuirle un peso del orden del 80%.

La presencia del español en la Internet aumenta considerablemente, y esto gracias particularmente a los tres segmentos de producción de contenidos que son España, América Latina y los Estados Unidos. Sin embargo, la representación del español no ha llegado aún a un nivel acorde con su población en el mundo real, pese a que se acerca progresivamente. A medida que aumenta la presencia de contenidos en español va mejorando la representación de los valores culturales hispanos, como ha sido el caso en los tres últimos años.

La presencia de una importante población de habla hispana en los Estados Unidos podría ser un vector para la producción de contenidos en español. Sin embargo, los primeros datos indican una débil productividad y queda por evaluar si esos contenidos transportan valores culturales hispanos o si son, en su mayoría, vectores del comercio electrónico y de la cultura asociada a la globalización económica.

La comparación con el francés, que tiene una representación proporcionalmente más alta, sirve para apoyar el valor de las políticas de producción de contenidos coordinadas entre los países de habla hispana y de incentivos a la producción de contenidos en español en los Estados Unidos, políticas que han de estar orientadas a la promoción de las culturas hispanas. Valdría la pena examinar más en detalles la situación del portugués y establecer si hay lugar para políticas combinadas entre el español y el portugués.

Las evoluciones en el área de Internet son rápidas y afectan en gran medida los ámbitos económicos y culturales. Es aconsejable proceder a un seguimiento amplio, permanente y que tenga un carácter científico de esas evoluciones para poder sostener y/o evaluar las políticas que se hayan definido.

Una línea estratégica evidente para la consolidación del espacio hispanófono en el mundo virtual es la alianza con los dos espacios latinos vecinos: el lusófono y el francófono .

 

FUENTES, REFERENCIAS Y BIBLIOGRAFIA

SITIOS WEB DE REFERENCIA

Estudios acerca de la presencia lingüística en la web.

Referencia lingüística

Datos demográficos acerca de la Internet

Firmas de consultores haciendo sondeos y/o produciendo datos

BIBLIOGRAFIA

Articulo de interés sobre la Internet que abordan la cuestión lingüística

El español en la Internet

El francés en la Internet

Articulos de Funredes sobre la temática

Otros


1 Cifra que pasó los 500 millones en julio 2001, según NUA.
2 Como la Organización Internacional de la Francofonía
(http://www.francophonie.org/), la Agencia Universitaria de la Francofonía (http://www.aupelf-uref.org/) o el Centro para el Desarrollo de la Infopista en Francés (http://www.cidif.org/).
3 Por ejemplo, el Fondo francófono para la autopista de la información (
http://www.francophonie.org/fonds).
4En 1992, había más usuarios del Minitel que de las redes existentes (Bitnet, Internet, etc.).
5 En oportunidad del tercer estudio, con el apoyo de la Agencia de la Francofonía y de la Unión Latina, y a partir del tercer estudio, con la colaboración lingüística de la Unión Latina.
6 Español, francés, italiano, portugués y rumano.
7 Un cociente igual a 1 debe considerarse así como resultado "normal"; si es inferior a 1, se considera
débil y si es superior a 1, respetable.
8 Las desviaciones son inferiores al 25% en valor absoluto y difícilmente se pueden sacar conclusiones a propósito de estas pequeñas variaciones, que están probablemente dentro de los intervalos de confianza de las cifras anunciadas por Global Reach, establecidas sin metodología estándar para todos los idiomas.
9 La proporción de hablantes de lenguas distintas del inglés que producen (o traducen) páginas en inglés es muy elevada.
10 En principio se puede proceder a una búsqueda indicando una fecha de inicio y una fecha de final.
11 En total son un poco mas de 1000 personajes.
12 Una nota de 100 indica un predominio absoluto, una nota de 0 la ausencia de personajes.
13 Principalmente por las letras inglesas.
14 Principalmente por el cine inglés.
15 Principalmente por las artes plásticas holandesas.
16 La canción inglesa resulta en primera posición en esta categoría.
17 Incluimos Brasil aunque no se trata de un país hispanófono, considerando que su inserción en el contexto económico del MercoSur debía representar un incentivo para producir contenidos en español. El resultado confirma la premisa pues la cifra de producción de paginas en español de Brasil es cercana de la de Uruguay!
18 Ricardo Baeza-Yates de Chile, Erick Iriarte de Perú y Oscar Robles-Garay de México.
19 Suponiendo que la misma cifra de proporción de numero de sitios web fuera del dominio nacional se aplica a las páginas.
20 Según el trabajo de Ricardo Baeza-Yates para Akwan, 2001 (http://www.akwan.com.br).
21 Margen superior de una aproximación de Funredes quien considera que entre 94% y 98% del web estadounidense no esta utilizando el dominio .US.
22 Fuente: Global Reach.