Google ajoute une première langue autochtone du Canada à son service de traduction

Brittany Hobson, La Presse Canadienne
Google ajoute une première langue autochtone du Canada à son service de traduction

L’une des langues autochtones les plus parlées au pays est désormais disponible sur le service de traduction de Google. C’est la première fois que le géant de la technologie inclut une langue des Premières Nations, métisse ou inuite parlée au Canada sur sa plateforme.

L’inuktut, un terme général englobant différents dialectes parlés par les Inuits au Canada, au Groenland et en Alaska, a été ajouté à Google Traduction, qui traduit des textes, des documents et des sites web d’une langue à une autre.

Le dernier ajout fait partie d’une initiative de Google visant à développer un modèle linguistique d’intelligence artificielle unique pour prendre en charge 1000 des langues les plus parlées au monde.

Environ 40 000 personnes parlent l’inuktut au Canada, selon les données de Statistique Canada.

Le nombre de locuteurs à lui seul ne suffit pas à déterminer si une langue peut être incluse dans Google Traduction, a indiqué Isaac Caswell, ingénieur logiciel principal de la plateforme.

Il doit également y avoir suffisamment de données textuelles en ligne à partir desquelles extraire pour créer un modèle linguistique.

D’autres langues autochtones du Canada «n’ont tout simplement pas assez de données pour avoir un modèle de traduction automatique utilisable», a expliqué M. Caswell.

Par exemple, les ingénieurs ont envisagé ajouter le cri, qui est parlé par plus de 86 000 personnes au Canada, mais il y avait moins de sites web dans cette langue sur lesquels puiser.

«Nous ne voulons pas mettre quoi que ce soit sur le produit qui ne produise que du texte brisé ou qui n’a aucun sens», a souligné M. Caswell.

«L’inuktut se distingue vraiment par le fait qu’il contient beaucoup de données épurées et bien écrites, car, je pense, la communauté en ligne augmente.»

La communauté appelée à contribuer

Lorsqu’elle ajoute une langue à Google Traduction, l’entreprise technologique examine deux éléments principaux: s’il existe un désir ou un besoin de la part de la communauté et dans quelle mesure cela est techniquement réalisable.

Après que Google eut déterminé que son modèle pouvait reconnaître l’inuktut, il a commencé à consulter les locuteurs et les organisations de la langue.

L’entreprise a fait appel à Inuit Tapiriit Kanatami, l’organisation nationale qui représente environ 70 000 Inuits au Canada, pour s’assurer que le développement du modèle soit fidèle à la langue inuktut, y compris la capacité de traduire les deux systèmes d’écriture de la langue.

L’inuktut utilise le qaniujaaqpait, ou syllabique, et le qaliujaaqpait, qui utilise l’alphabet romain.

Inuit Tapiriit Kanatami a développé son propre ensemble de données de caractères communs qui peuvent être utilisés pour écrire dans n’importe quel dialecte de l’inuktut afin de faciliter la communication écrite entre les différentes régions inuites.

«Si nous n’avions pas eu leur aide, nous aurions simplement pu lancer le modèle en syllabique, ce qui compromet certains de leurs travaux actuels», a expliqué M. Caswell.

L’organisation a salué le travail de Google visant à inclure l’inuktut, évoquant la nécessité de revitaliser, de protéger et de promouvoir les langues inuites.

«L’ajout de l’inuktut sur une plateforme aussi largement utilisée permet aux Inuits d’interagir plus pleinement dans le monde numérique», a déclaré Natan Obed, président d’Inuit Tapiriit Kanatami, dans un communiqué.

Des communautés négligées

Avec l’introduction de l’inuktut, Google vise à être plus représentatif d’un groupe de personnes souvent négligé par le secteur technologique.

«J’espère, peut-être même que cela leur permettra de se sentir un peu plus reconnus par une grande entreprise technologique. Parce que, en général, les communautés autochtones ont eu beaucoup l’expérience d’être négligées par la technologie», a souligné M. Caswell.

Les utilisateurs auront la possibilité de traduire l’inuktut écrit en anglais et vice versa grâce à Google Traduction. D’autres options, notamment l’outil de traduction verbale, pourraient être proposées ultérieurement, a ajouté M. Caswell.

L’utilisation de l’IA pour promouvoir les langues autochtones n’est pas sans limites, a-t-il reconnu, mais il pense que cela changera à mesure que de plus en plus de langues seront accessibles grâce à une technologie améliorée.

Partager cet article
S'inscrire
Me notifier des
guest
0 Commentaires
plus ancien
plus récent plus voté
Inline Feedbacks
Voir tous les commentaires