Au 1er juillet 2021, il y avait sur la planète plus de 4,8 milliards d’internautes, soit 61 % de la population mondiale. Un chiffre en constante augmentation, tout comme le volume des contenus publiés. Cependant, pas moins de 80 % d’entre eux ne sont disponibles que dans dix langues occidentales, jamais traduits dans les langues africaines, pas même dans les plus importantes comme le swahili. Les traductions automatiques ont donc vocation à accélérer l’accès au savoir des populations qui ne parlent ni l’anglais ni le français, par exemple.

Du lingala à l’oromo

Le 15 mai dernier, Google a annoncé que le bambara (Mali), l’ewe (Ghana, Togo), le krio (Sierra Leone), le lingala (Afrique centrale), le luganda (Ouganda, Rwanda), l’oromo (Éthiopie), le sepedi (Afrique du Sud), le tigrinya (Érythrée, Éthiopie), le tsonga (Afrique du Sud) et le twi (Ghana) pourraient désormais être traduits par Google. Une bonne nouvelle, a priori, d’autant plus que Google Traduction est intégré par défaut sur de nombreux sites tiers ou des plateformes importantes comme Facebook ou Twitter. Pourtant, celle-ci ne va pas sans soulever quelques questions.

We’re adding 24 new languages to Google Translate — the first using a breakthrough machine learning approach called Zero-Shot Machine Translation, where the model learns a new language without ever seeing a direct translation of it. #GoogleIO https://t.co/5Imnj6ff1E — Google (@Google) May 11, 2022

Par exemple, pourquoi ces langues en particulier ont-elles été choisies parmi les 2000 que compte le continent ? On en sait très peu sur ce qui justifie le choix des ingénieurs de la firme américaine. Pourtant, des personnalités ressources africaines pourraient aider l’entreprise à étendre cette initiative. Avant cette annonce, d’autres langues du continent existaient déjà sur Google, comme le yoruba, avec des traductions souvent approximatives. Faut-il continuer d’intégrer de nouvelles langues ou perfectionner celles qui existent déjà ?

Mais le fonctionnement de Google Traduction est assez opaque. Pour offrir des résultats pertinents, Google absorbe allègrement des millions de données diverses et variées, dans différents domaines. Mais où va-t-il les trouver lorsqu’il s’agit des langues africaines ? Sachant que les locuteurs de ces idiomes produisent très peu d’écrits sur le web, les producteurs de ces données absorbées par Google sont-ils rémunérés à leur juste valeur pour leur contribution à l’outil ? Car oui, l’outil est gratuit (pour le moment) mais il s’agit bien là d’un apport intellectuel à une entreprise commerciale. Son chiffre d’affaires en 2020 s’élevait à 182,52 milliards de dollars. Notre enjeu est donc de revitaliser nos langues, qui ont une valeur réelle, tout en gardant le contrôle de nos données et en protégeant leur intégrité.

Effort collaboratif

Ces données, dont la source n’est pas connue, ne sont pas non plus disponibles en accès libre pour les développeurs qui souhaitent proposer des outils concrets aux populations éloignées du numérique du fait de leur langue. Aucun site public n’existe pour aller les consulter. Pourtant, en intégrant de nouvelles langues, Google, de par sa puissance commerciale et de communication, invisibilise des initiatives plus collectives – dont les données sont clairement ouvertes – de traduction automatique. Il en existe pourtant qui aurait mérité d’être soutenu et encouragé par la firme internationale.

Ainsi, le collectif Idemi Africa appelle la firme à rendre plus transparente sa politique d’intégration des langues africaines, à réaliser un effort collaboratif plus important avec des acteurs déjà existants et à rendre ces données accessibles. Il s’agit de traiter les personnes qui parlent les langues africaines comme des co-créateurs de ces outils en les rémunérant par exemple, et non plus comme des personnes dont on siphonne la langue.

La langue, c’est plus qu’un ensemble de mot, c’est une façon de penser et d’être en relation avec l’autre… Aussi, comme le dit Souleymane Bachir Diagne, citant Ngugi wa Thiong’o, la traduction est « la langue des langues » et elle mérite qu’on s’y investisse avec humilité et avec de réelles ressources humaines.