Les intelligences artificielles (IA) sont aujourd’hui capables de « s‘exprimer » dans les principales langues du monde. Mais il leur reste des progrès à faire quand il s’agit du breton – sans même parler du gallo. Et c’est un vrai problème.
Les IA font désormais partie de notre quotidien. Elles mettent en forme nos notes, génèrent des sous-titres et créent des sites Internet ex nihilo. Les entreprises s’en emparent pour rester compétitives. Dans cette révolution, les plus avantagés sont logiquement ceux dont la langue est facilement comprise par les IA. Et pour que ce soit le cas, il faut que des textes écrits dans cette langue soient massivement présents en ligne. Les locuteurs d’une langue minoritaire sont condamnés à rater le train – ou à changer de vocabulaire.
Circonstance aggravante
Un exemple ? Il n’existe pas de reconnaissance vocale des SMS en breton. Donc « les brittophones habitués à échanger entre eux en breton passent massivement au français chaque fois qu’ils peuvent échanger en SMS dictables. Circonstance aggravante, cela touche en premier les plus jeunes générations », alerte Mélanie Jouitteau, chercheuse bretonne au CNRS.
Une solution consisterait à nourrir les IA avec un maximum de documents en breton. Malheureusement, on manque encore d’outils permettant de transformer les textes scannés en données lisibles par la machine.
L’IA remplace le corbeau par une belette jaune
ChatGPT, célèbre IA génératrice de textes, se targue pourtant d’être capable de s’exprimer dans la langue d’Anjela Duval. Si on lui demande de traduire une certaine fable de La Fontaine, le résultat est compréhensible… Jusqu’à ce qu’on s’aperçoive que le corbeau et son fromage sont remplacés par une « belette jaune ». Peut-être car cet animal est souvent associé au renard dans les chansons ? En gallo, c’est encore pire : l’IA invente des mots qui relèvent plutôt de l’argot de Paris.
La Région est consciente de ce fossé grandissant. En décembre, le Conseil économique, social et environnemental régional (Ceser) a rendu un avis reconnaissant comme « indispensable que la langue bretonne puisse bénéficier des progrès de l’intelligence artificielle » notamment pour « produire et diffuser des applications originales spécialement destinées à la langue bretonne ».
Ce n’est pas le seul domaine dans lequel la machine doit s’améliorer pour prendre en compte les spécificités régionales. Les IA génératrices d’images souffrent des biais de leurs créateurs – majoritairement américains. Elles produisent de somptueuses photos de hamburgers mais, lorsqu’on leur demande une galette-saucisse, elles dessinent une pizza. Elles ignorent à quoi ressemblent les costumes traditionnels, les créatures folkloriques et même le fest-noz, pourtant reconnu par l’Unesco. On a demandé à une IA grand public de fabriquer la photo d’un « robot brandissant le drapeau breton ». Le résultat, qui illustre cet article, montre le chemin qu’il lui reste à parcourir.
Pour vous tenir au fait, cet article à propos du thème « Formation Bretagne », vous est fourni par opcalia-bretagne.com. Le but de opcalia-bretagne.com est de parler de Formation Bretagne dans la transparence la plus absolue en vous procurant la connaissance de tout ce qui est en lien avec ce thème sur la toile La chronique se veut générée de la manière la plus complète que possible. Pour toute remarque sur ce sujet concernant le sujet « Formation Bretagne » merci de contacter les contacts indiqués sur notre site internet. Il y a de prévu de multiples articles autour du sujet « Formation Bretagne » prochainement, nous vous invitons à consulter notre site web à plusieurs reprises.
We use cookies to personalise content and ads, to provide social media features and to analyse our traffic. We also share information about your use of our site with our social media, advertising and analytics partners. View more
Cookies settings
Accept
Privacy & Cookie policy
Privacy & Cookies policy
Cookies list
Cookie name
Active
Politique de confidentialité:
Transmission de vos datas personnelles:
Tous textes des internautes peuvent être vérifiés avec un travail robotisé de détection des commentaires impolis.
Utilisation et transmission de vos datas privatives:
Au cas où vous sollicitez une purge de votre mot de passe, votre adresse IP sera saisie dans l’e-mail de remise à zéro.
Informations placées à partir d’autres sites:
Les passages de ce site peuvent enfermer des données constituées (comme des vidéos, fichiers, articles…). Le contenu embarqué à partir d’autres sites se comporte de la même manière que si le visiteur se rendait sur cet autre site.Ces sites internet pourraient collecter des données au sujet de vous, appliquer des cookies, embarquer des moteurs de contrôles autres, conserver vos réactions avec ces contenus chargés si vous disposez d'un espace connecté sur leur site internet.
Cookies:
Dans les cas où vous envoyez un texte sur le site, vous serez amenés à enregistrer vos nom, e-mail et site dans des cookies. Cela a pour but uniquement dans le but de votre facilité d'utilisation afin de ne pas avoir à donner ces datas dans l'éventualité où vous consignez un nouveau commentaire ultérieurement. Ces cookies disparaissent au bout d’un an.Dans les cas où vous vous rendez sur la partie de connexion, un cookie transitoire sera activé pour constater si votre logiciel de navigation supporte les cookies. Cette fonction ne contient pas de données privées et sera supprimé automatiquement à la fermeture votre browser.Lorsque vous accédez, nous mettrons en place certains cookies afin d'établir vos données de login et vos options de navigation. L'espérance d'existence d’un cookie de l'enregistrement est de 2 jours, l'espérance de vie d’un cookie d'utilisation est de plusieurs mois. Dans les cas où vous marquez « Se souvenir de moi », votre cookie de connexion sera archivé pour moins d'un mois. Quand vous engagez la déconnexion de votre espace personnel, le cookie de login sera abrogé.En modifiant ou si vous diffusez un article, un cookie de plus sera créé dans votre terminal. Ce cookie n'est constitué d'aucune identification privée. Il confirme simplement l’identifiant du post que vous venez de remplacer. Il expire au bout de 24 heures.
Conditions Générales d'utilisation conformes à la RGPD
Durées de mémorisation de vos données:
Au cas où vous enregistrez un commentaire, le texte et ses données complémentaires sont stockés indéfiniment. Ce processus valide de rapporter et accorder mécaniquement les textes suivants au lieu de les transmettre dans la liste du modérateur.Quand les espaces personnels qui s’insèrent sur le site (le cas échéant), nous archivons aussi les informations privatives signifiées dans leur espace privé. La totalité des comptes peuvent voir, modifier ou supprimer leurs données privées à tout moment. Les webmasters du site ont la possibilité aussi intervenir sur ces datas.
Commentaires sur notre site:
Si vous écrivez un commentaire sur le présent site, les déclarations transcrites dans le formulaire de texte, ainsi que l'identification IP et l'identifiant utilisateur de votre browser sont mémorisés dans le but de nous donner la possibilité de déceler des commentaires non autorisés.
Les droits que vous avez sur vos datas:
Quand vous détenez un profil ou si vous avez laissé des commentaires sur le site, vous avez la possibilité de solliciter à héberger un dossier numérique accumulant en total les informations privées que nous contrôlons à votre sujet, incluant celles que vous nous avez consenties. Vous pouvez également de réclamer l'annulation des informations personnelles à votre sujet. Cette fonctionnalité ne prend pas en compte les datas stockées à des fins de statistiques, dans le respect du droit ou avec pour objectif de sécurité.
Médias:
Quand vous déposez des photos sur notre site, nous vous proposons de ne pas uploader des photographies introduisant des identifiants EXIF de données GPS. Les gens explorant le site ont la possibilité de enregistrer des informations de positionnement à partir de ces images.