FUNREDES: LAS PUBLICACIONES DE FUNREDES
Editoriales
¿Qué hay de nuevo?
Nuestros servicios
FAQ

Página principal
La institución
Trabajos hechos
Búsqueda interna
Sobre este sitio
Sitio @ Funredes.org

FUNREDES : LAS PUBLICACIONES DE FUNREDES : Documento

Multilingüismo en la Internet: ¿Cúal sera el tercer idioma?
Autores principales: Daniel Pimienta
Fecha de creación: 1999-08-01
Fecha de modificación de HTML: 2000-11-15
Lengua original: Français
Regiones: América Latina y el Caribe
Temas: El impacto lingüístico de los NTIC
Editorial: boletín del CIDIF, Initi@tives99
Tipo de documento: Publicaciones
Ver documentos relacionados

Les bases démolinguistiques de cet article proviennent d'échanges de courriers avec Monsieur Daniel Prado, Directeur du Programme de Terminologies et Industries de la Langue de l'Union Latine que nous remercions pour nous permettre d'en publier le contenu.



Un rapport publié par Computer Economics1 annonce, avec grande précision, que 57% des utilisateurs de l'Internet parleront une langue autre que l'anglais en 2005. Admettons cette donnée prospective fabriquée à partir des prévisions de croissance du nombre d'utilisateurs de l'Internet. Mais qu'en sera-t-il alors des ressources d'informations qui seront proposées à cette majorité de personnes non anglophones? Seront-elles majoritairement dans des langues autres que l'anglais? Les conducteurs virtuels des autoroutes de l'information non anglophones pourront-ils trouver des bretelles d'accès dans leurs langues ou bien seront-ils obligés d'apprendre l'anglais pour emprunter les grands axes autoroutiers, se contentant, dans leur langue, de parcourir les voies secondaires et des chemins vicinaux?

De quels éléments dispose le chercheur pour apporter une réponse à ces interrogations importantes pour l'avenir des langues et des cultures de la planète? L'Internet est à la fois le vecteur et le reflet d'un phénomène irréversible de mondialisation. Quels éléments du passé et du présent sont particulièrement déterminants et quels sont les paramètres qui vont déterminer les évolutions futures? Nous essayons ici d'apporter quelques réponses préliminaires à ces questions et d'ouvrir une nouvelle voie de recherche sans la prétention d'apporter pour le moment autre chose que des pistes et des indices.




LA PRÉHISTOIRE

Avant la naissance de Gopher2, en 1991, l'essentiel des informations des réseaux était constitué par des messages échangés par des chercheurs ou des ingénieurs des entreprises concernées par les technologies de l'information, directement ou à travers des conférences électroniques. Le "leadership" de l'anglais s'est établi à cette période (entre 1970 et 1990), et on pouvait déjà l'estimer à plus de 90% des ressources d'information3. L'importance de ce premier chiffre provient du fait que la tradition des échanges internationaux des scientifiques et des professionnels de l'informatique était déjà solidement établie en anglais. Durant cette période, il était très courant que deux francophones échangent des courriers électroniques en langue anglaise. De plus, les limitations d'un codage de l'information à 7 bits (le code ASCII) représentaient un handicap initial certain pour les langues riches en diacritiques4.


L'HISTOIRE RÉCENTE

L'apparition du Gopher a permis aux universitaires de commencer à organiser des ressources d'information de type scientifique avec une proportion probablement comparable (85-90%?) de sources en anglais. En 1992, la naissance du world wide web accompagne les débuts de la massification de l'usage de l'Internet et de la mise en commun des ressources d'information sur la toile. Il est certain que les premières années voient un essor prioritaire des utilisateurs et des ressources d'information des USA et que la proportion de pages web a du rester dans le même ordre de grandeur (85-90%) dans les premières années de l'histoire récente de la Toile (1992-1995)5.

LE PRÉSENT

Entre 1996 et 1999
, la forte avance initiale pris par les Etats-Unis commence lentement à se réduire, quoique marginalement, dans les autres pays industrialisés (Québec, France, Espagne et autres pays d'Europe ainsi qu'au Japon) et très lentement dans les régions en développement les plus avancées (Amérique Latine et Asie). Ainsi, la place relative de l'anglais dans la Toile recule lentement mais régulièrement, jusqu'à un probable 75% en 1998.

Voir à ce sujet les travaux de Funredes publiés entre Mars 1996 et Mars 19986 et sa dernière étude conjointe avec l'Union Latine7 et l'Agence de la Francophonie publiée en septembre 1998, le tout consultable à:
<http://funredes.org/LC>.


Si les tendances se confirment, la croissance exponentielle du nombre des utilisateurs de l'Internet devrait continuer à s'infléchir aux USA8 alors qu'elle se poursuivra dans les autres régions pour encore quelques années. Il est donc probable que la position forte de 75% de ressources en anglais devrait reculer dans les années qui viennent.

Quelle limite absolue ce recul pourra-t-il atteindre?
Cela dépend essentiellement de trois facteurs, le premier pratiquement intangible et les deux autres plus difficile à déterminer:
- les pourcentages respectifs de personnes parlant les langues principales de la planète,
- l'incitation pour la réalisation de sites multilingues,
- le choix des langues pour les sites multilingues.

A quelle vitesse ce recul pourra-t-il se produire?
Cela dépend des politiques de développement de sites Internet dans des régions de langues majoritaires où l'essor est pour le moment extrêmement marginal (la Chine, l'Inde et les pays Arabes) et aussi de la masse globale de création de sites sur la Toile dans des langues locales.

Selon une très intéressante présentation du CIDIF9 sur les langues dans l'Internet, il y aurait moins de 3000 langues encore parlées dans le monde et les 10 langues les plus parlées sont, pour un total de 6000 millions d'êtres humains, celles présentées dans le tableau ci-après:

MILLIONS DE PERSONNES % pop. mondiale
CHINOIS 885 14.75%
ANGLAIS 450 7.50%
HINDI-URDU 333 5.55%
ESPAGNOL 266 4.43%
PORTUGUAIS 175 2.92%
RUSSE 153 2.55%
ARABE 150 2.50%
JAPONAIS 126 2.10%
FRANÇAIS 122 2.03%
ALLEMAND 118 1.97%
TOTAL 2778 46.30%

Il est très délicat d'établir des chiffres sur les personnes qui parlent une langue donnée10 car il y a plusieurs définitions possibles. De plus, il n'est pas toujours facile de comptabiliser chacune des définitions. Selon Daniel Prado, les définitions à considérer sont les suivantes:
- les locuteurs de langue maternelle (chiffres plutôt bien connus);
- les locuteurs d'une langue dans des pays ayant cette langue comme officielle ou d'enseignement (chiffres assez connus);
- les locuteurs pouvant s'exprimer aisément dans une langue donnée (chiffres très difficiles à déterminer qui peut être parfois inférieur au précédent qui inclut des locuteurs qui ont des difficultés d'expression11 et parfois supérieur parce que certaines langues ont du succès en dehors de leur aire naturelle).

Ainsi, un recoupement de diverses sources crédibles, réalisé par Daniel Prado, apporte les données partielles suivantes concernant l'anglais et certaines langues latines:

  Chiffres du CIDIF Locuteurs de langue maternelle Locuteurs officiels ou enseignement Locuteurs s'exprimant avec aisance
ANGLAIS 450 450 630 500
ESPAGNOL 266 350 37512 36513
PORTUGAIS 175 17014 19015 18016
FRANÇAIS 122 7517 13018 90

Si nous remplaçons les chiffres des langues mentionnées dans le tableau précédent par la dernière colonne de ce tableau et que nous arrondissons les chiffres nous obtenons un nouveau tableau qui permet de déterminer les conditions initiales démolinguistiques pour pouvoir effectuer un travail prospectif.


MILLIONS DE PERSONNES % Pop.
CHINOIS 900 15.0%
ANGLAIS 500 8.3%
ESPAGNOL 360 6.0%
HINDI-URDU 330 5.5%
PORTUGUAIS 180 3.0%
RUSSE 150 2.5%
ARABE 150 2.5%
JAPONAIS 120 2.0%
ALLEMAND 110 1.8%
FRANÇAIS 90 1.5%
TOTAL 2890 48.2%


LE FUTUR

Un jeu d'hypothèses (très) simplificatrices permet de déterminer une limite absolue du poids relatif de l'anglais dans l'espace de la Toile.

- Le nombre de sites web dans une langue donnée sera à terme proportionnel aux nombres de locuteurs s'exprimant aisément dans cette langue.
- Tous les sites non anglophones sont bilingues et l'anglais apparaît systématiquement comme deuxième langue. Les sites originaux en anglais restes monolingues.
- Les pages ne sont pas multilingues (c'est à dire que les sites multilingues sont composées de pages séparées dans des langues distinctes).

Selon ce cadre très simpliste, la place des langues dans la toile serait, à terme:


Chiffres limites % Chiffres actuels (98) %
CHINOIS 7.5% ?
ANGLAIS 54% 76.35%
ESPAGNOL 3% 2.57%
HINDI-URDU 2.75% ?
PORTUGUAIS 1.5% 0.83%
RUSSE 1.25% 1.25%
ARABE 1.25% 1.25%
JAPONAIS 1% 4.76%
ALLEMAND 0.9% 4.37%
FRANÇAIS 0.75% 2.86%
AUTRES 24.1% 8.12%

Le chiffre de l'anglais est de 50% (puisque, par hypothèse, tous les sites sont en anglais et dans une langue locale) plus 4.15% (la moitié du pourcentage des sites en anglais). Les chiffres des autres langues se calculent en divisant par deux les pourcentages du tableau précédent.


BESOIN D'HYPOTHESES PLUS FINES

Comment est-il possible d'améliorer le jeu d'hypothèses? Il est clair que le nombre de sites web dans une langue n'est pas proportionnel au nombre de locuteurs et qu'il ne pourrait pas tendre vers cette valeur tant que les accès à l'Internet ne seront pas équitablement répartis. Une meilleure hypothèse serait alors d'établir que le nombre de pages web dans une langue donnée sera, à terme, proportionnel au nombre de locuteurs de cette langue qui ont un accès à l'Internet. Cette hypothèse nous conduirait naturellement à distinguer les locuteurs des pays industrialisés (où le taux d'accès est très important) et ceux des pays en développement (où le taux d'accès restera longtemps plus faible à cause des problèmes d'infrastructures19). Ainsi il faudrait établir pour chaque langue la quantité de locuteurs des "pays du Nord" (N) et ceux des "pays du Sud" (S). Partant d'une formule de type L = N + S, il serait possible de calculer ensuite la valeur de travail:
L'= Tn x N + Ts x S
où Tn est le taux de connectivité à l'Internet dans le Nord et Ts la même valeur dans les pays du Sud. Pour le moment une première approximation donnerait Tn=10 x Ts. Ce facteur expliquerait pourquoi, sur la toile, les chinois de Hong Kong pèsent probablement autant ou plus que les chinois du reste de la Chine ou bien pourquoi l'Amérique Latine pèse moins que l'Espagne en termes de pages web20!

La détermination de la valeur de L' pour chaque langue nous permettrait de refaire un cadre prévisionnel plus crédible sans grande difficulté. La parole est de nouveau aux démolinguistes pour la détermination de N et S!

Il est évident que les valeurs de Tn et de Ts dépendent des pays, ou des régions. Nous avons vu que la croissance de la valeur de Tn aux Etats-Unis est en train de passer par un point d'inflexion qui permet donc d'envisager de percevoir la limite de cette croissance. Un référentiel utile à ce sujet pourrait être le Minitel français qui montre un plafond lorsque approximativement 25% des citoyens sont équipés. Pour toutes les technologies destinées au grand public il existe un niveau de saturation des marchés qui peut correspondre, dans l'absolu, au rapport nombre de familles / nombre d'habitants.

D'autre part, l'hypothèse selon laquelle tous les sites devront être multilingues ne prend pas en compte le phénomène de la prévisible expansion de l'usage local de l'Internet. La production d'information à vocation locale a une place importante dans l'Internet et elle a pour vocation d'être soutenue par la langue la plus parlée localement sans que le besoin de multilinguisme ne soit prépondérant. Cela représente d'ailleurs l'espoir de voir une meilleure représentation des langues non majoritaires sur la toile. Par contre pour la production globale, celle en particulier liée au commerce électronique, le besoin de multilinguisme s'imposera de plus en plus. Un meilleur modèle de prévision devra donc faire une estimation de la proportion de sites web à vocation locale (monolingues) et de ceux à vocation globale (multilingues). Une fois de plus, l'observation de la télématique du passé (Minitel) nous laisse entrevoir une croissance relative plus forte des sites locaux dans les années à venir.

Mais tous ces facteurs sont relativement marginaux en face de la question essentielle: quel multilinguisme? L'hypothèse du bilinguisme résiste difficilement à l'analyse des besoins des sites du commerce électronique qui auront vocation à multiplier les langues d'accès pour ouvrir leur marché. Les sites multilingues de demain seront donc dans une langue locale, en anglais et dans une troisième langue (et éventuellement dans d'autres langues supplémentaires).


LA TROISIEME LANGUE

Quelle sera alors la troisième langue? Dans plusieurs cas elle pourrait être la langue de la région (ainsi les Brésiliens pourrait donner la préférence à l'espagnol après le portugais et l'anglais et réciproquement les autres pays de la région favoriseront le portugais en espérant ainsi approcher commercialement leur voisin géant) dans d'autres cas elle pourrait être une langue d'affinité culturelle et commerciale (comme le français en Haïti ou dans plusieurs pays africains).

Les langues qui ont une importance au delà des frontières des pays où elles sont nées ont un chance à saisir dans l'Internet car elle peuvent représenter, après l'anglais, une langue véhiculaire du commerce (et de la culture) dans des régions données. C'est le cas du français (en particulier en Afrique), de l'espagnol, du portugais, et certainement d'autres langues dans l'espace commercial asiatique (le chinois?) et celui des pays arabes (l'arabe d'Egypte?).

Si la troisième langue finit par s'imposer, la place relative de l'anglais sur la toile pourrait finir par passer en dessous de la barre des 50% et se rapprocher alors des 35%21...

Enfin, si le phénomène des sites (monolingues) en langues locales s'amplifie et occupe, par exemple, la moitié de l'espace des sites Internet, la valeur limite de l'anglais pourra finalement tomber à un chiffre inférieur de moitié au précédent soit une limite inférieure absolue pour la présence de l'anglais de l'ordre de 18%. Dans le cadre de cette hypothèse peu plausible pour les cinq années à venir, mais raisonnable à plus long terme, les langues qui pourront se tailler une bonne position dans la place de "la troisième langue" pourraient voir leur pourcentage s'approcher de celui de l'anglais, voire même le dépasser, dans le cas du chinois.


Quelques langues seulement peuvent prétendre à cette place "d'outsider". Les enjeux vont évidement plus loin que les seuls aspects linguistiques et culturels dans un monde où le commerce électronique prendra progressivement une place essentielle. Une véritable politique de présence linguistique s'impose pour les langues concernées, des mesures coordonnées dont les effets pourraient être ressentis dans un délai de 5 ans. Parmi les actions urgentes, la mise en place de politiques de production et/ou d'incitation à la production de contenus sur l'Internet ainsi que des observatoires de la mesure linguistiques des contenus pour suivre les évolutions et adapter les politiques.



NOTES :

1 : http://www.computereconomics.com
2 : Second service global de l'Internet qui offre l'accès par menu à de l'information parsemée dans les différents serveurs de l'Internet.
3 : Ressources volatiles puisque l'organisation du stockage de l'information dans les réseaux n'était pas encore au point (seul le transfert de courrier électronique et de fichier était possible).
4 : Une note "sans accent" en français ou en espagnol perd de sa lisibilité. Par contre, l'anglais est une langue qui n'utilise pas de signes diacritiques sur l'alphabet romain.
5 : Le succès indéniable du Vidéotex dans les autres pays, et surtout en France, a sans aucun doute joué un rôle de ralentisseur dans l'essor du web dans les pays industrialisés hors Etats-Unis.
6 : Avec l'appui scientifique de l'Union Latine pour la dernière étude de Mars 1998.
7 : Avec le soutien de la Direction Générale de la Langue Française.
8 : "Internet Growth Rate Slows", Peter H. Salus, Matrix News No 905, Mai 1999.
9 : http://w3.cidif.org/publications/presentations/powerpoint/argentine
10 : Par exemple suédois parlant anglais ou roumains parlant français.
11 : Comme par exemple des Haïtiens parlant créole et ne comprenant pas bien le français où des africains comprenant mal l'anglais dans des pays où il est langue officielle (par exemple, au Zimbabwe).
12 : Sources concordantes: Union Latine, Unesco, Institut Cervantés.
13 : Source: Union Latine.
14 : Source: Union Latine (1998), par la démolinguiste C. Couvert.
15 : Source: Union Latine (1998), par la démolinguiste C. Couvert.
16 : Source: Union Latine.
17 : Sources concordantes: Agence de la Francophonie et Union Latine.
18 : Source: Agence de la Francophonie.
19 : Pour prendre un seul exemple, bien documenté par l'UIT, le nombre de téléphone par habitant est proche de 50% dans les pays de l'OCDE et se situe autour de 5% dans les pays du Sud.
20 : Nous n'avons pas vérifié ces deux assertions qui sont donc des suppositions.
21 : 100/3 + 8.4/3 = 36.13%

contact@funredes.org
[ PÁGINA ANTERIOR | THIS PAGE IN ENGLISH | CETTE PAGE EN FRANÇAIS ]
[ MAPA DEL SITIO | INFO SOBRE ESTE SITIO | CONTACTAR AL WEBMASTER ]

Fundación Redes y Desarrollo

http://www.funredes.org/espanol/publicaciones/index.php3/docid/81/
Creado 1999-08-01 - Actualizado 2000-11-15
Copyright © 1999 FUNREDES