une production conjointe de Deaf Journalism Europe par Wille Felix Zante (Taubenschlag), Jos de Winde (DNieuws/Turkoois ) et Charlotte Berthier (Médiapi).
RÉSUMÉ
Avec l’essor de l’intelligence artificielle (IA), plusieurs startups ont prétendu avoir résolu le problème des avatars en langue des signes, qui n’étaient pas assez performants. Les avatars en langue des signes sont essentiellement des boîtes à outils qui visent plus ou moins à traduire la langue parlée ou écrite en langues signées au moyen de modèles informatiques animés ressemblant à des personnages animés de style Pixar sans grand effort. Ces derniers ont été victimes de l’effet « uncanny valley », le phénomène selon lequel les animations informatiques sont presque réalistes, mais semblent immédiatement « hors norme » pour l’œil humain. Cela signifie que les avatars en langue des signes qui remplacent les traductions humaines sont pour la plupart inutiles, car ils nécessitent presque autant de travail ou coûtent aussi cher que la traduction humaine. À l’automne 2023, une entreprise allemande a fait sensation dans les médias en vendant des kits d’avatars en langue des signes aux municipalités du pays, et les médias ont rapporté que l’IA pouvait être utilisée pour rendre les textes accessibles. Le résultat très discutable a été critiqué à juste titre par une initiative locale de sourds. Dans le même temps, l’Association nationale des sourds, la DGB, a annoncé qu’elle recommandait explicitement de ne pas utiliser d’avatars parce que la technologie n’est pas encore suffisamment mûre. Il est intéressant de noter que le porte-parole de la DGB était impliqué dans l’une des entreprises sourdes partenaires de l’entreprise productrice d’avatars (dirigée par des entendants). Nos recherches ont également révélé qu’il y a potentiellement des millions à gagner en vendant cette solution discutable et relativement « peu contraignante » aux municipalités du pays, puisque la loi allemande exige que les institutions publiques intègrent l’accessibilité à la langue des signes dans leurs sites Web. Le sujet est complexe et nous avons fait de notre mieux pour le condenser dans ce paragraphe récapitulatif. Pour plus de détails, continuez à lire l’article original qui va en profondeur, couvrant la question de la ruée vers l’or des avatars/de l’IA d’un point de vue allemand. Nous espérons que vous apprécierez cette expérience visant à apporter un journalisme d’investigation complexe aux communautés sourdes.
Tout au long de l’histoire, la communauté sourde a fait face aux innovations technologiques avec un mélange d’espoir et d’appréhension. De l’arrivée anxiogène des téléphones et des radios à l’ère de la télévision silencieuse et des télécopieurs, chaque progrès a apporté son lot de défis et d’opportunités. Aujourd’hui, à l’aube d’une nouvelle ère technologique marquée par l’émergence des avatars et de l’intelligence artificielle, la communauté des sourds se trouve à un autre carrefour. Mais qu’est-ce que cela signifie pour la communauté aujourd’hui, et comment cela s’inscrit-il dans le récit plus large du progrès technologique ? Ces questions seront explorées et les implications économiques et sociétales au sein de la communauté des sourds seront décortiquées. Nous avons eu l’occasion d’entendre les points de vue d’une experte à l’intersection des « études sur les sourds, des politiques linguistiques, de l’interprétation en langue des signes et des technologies d’IA en langue des signes », Maartje de Meulders, ainsi que de Ralph Raule, entrepreneur en accessibilité dans l’écosystème des sourds et défenseur de la numérisation au sein de l’association nationale allemande des sourds.
Après trois ans de recherche et de développement, l’introduction d’avatars en langue des signes sur les sites web des municipalités allemandes a eu lieu fin 2023. La boîte à outils, baptisée « Kommunaler Gebärdensprach-Avatar-Baukasten » (« kit d’avatars municipaux en langue des signes », « KGA-Baukasten » en abrégé), était basée sur un projet de recherche appelé AVASAG, mené par Charamel et yomma, deux entreprises basées respectivement à Cologne et à Berlin. La boîte à outils qui en découle est une offre de Charamel. L’objectif est simple : Créer un moyen plus rentable de rendre les sites web accessibles, en partant de l’idée que la plupart des contenus écrits, comme les informations sur la protection des données exigées par le GDPR, par exemple, sont pratiquement interchangeables d’un site à l’autre.
Pour cet article, Deaf Journalism Europe a étudié la situation actuelle en Allemagne, où l’Association nationale des sourds (NAD) a récemment déconseillé l’utilisation d’avatars en langue des signes, suite à la généralisation des services de traduction semi-automatique d’avatars. Nous nous en servons comme point de départ pour évaluer les risques et les chances pour la communauté sourde. L’expertise de la chercheuse sourde Maartje De Meulder, que nous avons interrogée par courrier électronique, couvre la perspective académique de cette question qui croise la technologie, l’éthique et l’économie.
L’histoire des avatars en langue des signes remonte à 1982 et est née de la nécessité de traduire la langue des signes en informations écrites. Cette entreprise s’est toutefois heurtée à des difficultés considérables. Contrairement aux langues écrites, les langues des signes n’ont pas de forme écrite universellement acceptée et s’appuient plutôt sur divers systèmes de notation tels que HamNoSys ou Stokoe, qui ne sont pas facilement traduisibles. En outre, l’absence de corpus exhaustifs pour les langues des signes complique encore le processus, empêchant des avancées similaires à celles observées dans la transcription et la traduction des langues écrites, facilitées par des technologies telles que DeepL ou Google Translate.
L’objectif à long terme des avatars est de remplacer les interprètes humains, ce dont nous parlerons avec la chercheuse Maartje De Meulder plus loin dans cet article. À court terme, ce n’est pas encore possible, mais plusieurs projets ont produit des avatars compréhensibles, même s’ils sont loin d’être parfaits. Si de nombreux projets de recherche et projets commerciaux ont impliqué des professionnels sourds, un projet a suscité la controverse l’année dernière en proposant directement des avatars à des institutions officielles et à des municipalités à la recherche de moyens rentables pour se conformer aux lois sur l’accessibilité, par ailleurs très indulgentes en Allemagne. Il est évident que l’objectif principal est de réduire les coûts, tout en résolvant le problème de la disponibilité des interprètes/traducteurs.
Les recherches menées par les partenaires du DJE ont permis de découvrir un document traitant de l’application du projet d’avatar municipal dans une ville. Ce document, qui sert de base à une décision du parlement de la ville en question, fait état d’un coût de 3 750 euros par an, un véritable vol comparé aux 170 euros de l’heure que coûteraient des interprètes en langue des signes en chair et en os. Ce chiffre est basé sur le tarif horaire généralement accepté en Allemagne pour deux interprètes dans la plupart des contextes, qui est de 85 euros par heure pour une personne. Le document ne mentionne pas que les traducteurs de films facturent généralement un tarif encore plus élevé en fonction du résultat : entre 70 et 120 euros par minute de film. Il est évidemment difficile de comparer l’interprétation et la traduction et cela montre à quel point les personnes qui décident en fin de compte connaissent mal le sujet.
Un représentant de la NAD dans un double rôle – entre commerce et politique
Quoi qu’il en soit, dans ces cas, les économies réalisées seraient très tangibles et inciteraient fortement les municipalités et autres administrations à adopter des avatars qui, à long terme, pourraient être de plus en plus automatisés. Lorsque le projet de recherche AVASAG a été lancé il y a trois ans, Charamel et yomma étaient heureux de travailler ensemble, mais à l’automne 2023, les premières fissures ont commencé à apparaître.
Le Kompetenzzentrum Gebärdensprache in Bayern (KOGEBA, anglais : « Sign Language Expertise Center in Bavaria »), une nouvelle initiative étroitement associée à l’Association des sourds de Munich, a protesté contre l’utilisation d’avatars en langue des signes et a critiqué le fait que l’une des personnes impliquées dans la coentreprise Charamel et yomma avait un double rôle en tant que représentant de la NAD. Interrogés par DJE partners, les deux porte-parole de l’entreprise et le représentant de la NAD ont affirmé que tout était en ordre et que l’expertise et l’expérience du représentant en matière de solutions techniques étaient les raisons exactes pour lesquelles il était impliqué dans le projet.
Pendant ce temps, des avatars construits par Charamel à l’aide de la boîte à outils apparemment développée dans le cadre du projet AVASAG ont commencé à apparaître sur des sites Web à l’échelle nationale, tous identiques mais adaptés aux villes dont ils prétendaient traduire le contenu.
Avance rapide jusqu’au printemps 2024. L’initiative bavaroise a publié une autre déclaration publique examinant les avatars produits à l’aide de la boîte à outils. Cette fois, elle se concentre sur les sites web qui ont déjà mis en œuvre les avatars, comme le musée Zeppelin de Friedrichshafen et plusieurs autres sites, appartenant pour la plupart à des municipalités, qui utilisent le kit d’avatars municipaux de Charamel. Ils trouvent que les avatars sont insuffisants, en particulier lorsque des mots personnalisés tels que les noms des villes sont utilisés. L’épellation digitale est critiquée comme étant trop lente, trop longue, les signes sont difficiles à comprendre, affirme KOGEBA.
Quelques jours plus tard, la NAD, en collaboration avec l’ association nationale des professeurs de langue des signes, l’ association nationale des malentendants et l’ association des interprètes sourds certifiés, a publié une autre déclaration brève et, je cite, « préliminaire » concernant l’utilisation des avatars : elle s’y oppose fermement. Le présentateur n’était autre que le représentant de la NAD précédemment critiqué pour son double rôle dans le projet de recherche AVASAG : Ralph Raule. Quelle est l’origine de ce clivage ? Nous avons contacté yomma, Charamel et bien sûr Raule. Tous ont répondu, à l’exception de yomma qui s’est excusé abondamment mais a déclaré ne pas pouvoir répondre pour l’instant. Au moment de la publication de cet article, ils n’avaient toujours pas répondu. La NAD n’a pas non plus publié la déclaration conjointe finale qui avait été annoncée. Lorsque nous l’avons interviewé au printemps 2024, Raule a insisté pour que nous le citions en tant que représentant de la NAD et non dans son rôle à la Yomma.
Mais tout d’abord, qu’est-ce qu’un avatar ?
Les avatars sont des représentations numériques utilisées dans les environnements virtuels. Un avatar en langue des signes est un personnage animé qui fait des gestes. Les avatars en langue des signes parlent la langue des signes. Plusieurs techniques peuvent être utilisées à cette fin.
La première est la capture de mouvement, où les signants portent un costume avec des marqueurs. Des caméras placées sous différents angles captent les mouvements, et les marqueurs aident à transformer les mouvements en animations que les représentations numériques utilisent.
La deuxième méthode est le codage. Il s’agit de convertir en code des éléments tels que la forme des mains, leur emplacement et leur direction, ainsi que les expressions faciales, la forme de la bouche, les yeux et les sourcils. Ces éléments sont ensuite programmés dans le mouvement.
Ces deux méthodes peuvent également être combinées, en utilisant la capture de mouvement pour les gestes individuels et en utilisant des instructions manuelles pour la transition et la combinaison des gestes.
Les avatars ont-ils un but ?
Maartje de Meulders, chercheuse belge spécialisée dans les deaf studies, déclare :
« Absolument, il existe des cas d’utilisation quotidienne pour la production/génération de la langue des signes sous la forme d’avatars (humains virtuels), par exemple dans des domaines tels que le secteur de l’hôtellerie, le tourisme et pour l’interaction semi-automatique avec les clients (comparable aux “chat bots”) ».
Dr. De Meulder se décrit comme travaillant à l’intersection des « deaf studies, des politiques linguistiques, de l’interprétation en langue des signes et des technologies de l’IA en langue des signes ». Elle est curieuse de savoir comment ces domaines « influencent la vie quotidienne et les droits des personnes sourdes, ainsi que le contexte plus large des droits de la langue des signes ».
Les avatars ont un avantage certain sur les interprètes en chair et en os dans certains cas d’utilisation. Il existe de nombreux endroits où les avatars pourraient être déployés. Dans les trains, à l’aéroport, sur les médias sociaux, ou pour rendre des lieux plus accessibles, surtout si l’on ne sait pas s’il y aura des utilisateurs sourds de la langue des signes.
Idéalement, les avatars ne devraient pas remplacer les interprètes en langue des signes, mais les compléter. « La traduction automatisée peut contribuer à atténuer certaines des limites actuelles des services d’interprétation en langue des signes, mais cela nécessitera d’importants progrès technologiques », explique M. De Meulder.
À l’avenir, vous pourrez peut-être déployer un avatar dans des situations où aucun interprète n’est disponible, ou peut-être dans des situations où vous préférez ne pas avoir d’interprète.
La technologie linguistique est fondamentalement une évolution positive, mais il reste encore beaucoup à faire pour la rendre utilisable. On peut également l’envisager dans le contexte des enfants sourds et de leurs parents entendants. Dans l’apprentissage de la langue des signes, un avatar peut également être un complément, par exemple entre les cours, afin que les parents qui veulent apprendre la langue des signes aient plus d’occasions de pratiquer. D’une manière générale, les avatars peuvent contribuer à la sensibilisation et à la visibilité des langues des signes.
Pourquoi les personnes sourdes s’opposent-elles autant aux avatars ?
La communauté sourde éprouve une certaine aversion pour l’utilisation d’avatars en langue des signes. De Meulder s’exprime à ce sujet :
« Actuellement, la plupart des avatars présentés aux utilisateurs sourds sont des prototypes et peuvent ne pas répondre entièrement aux besoins des utilisateurs. En règle générale, les développeurs entendants sollicitent un retour d’information en laboratoire, ce qui peut ne pas refléter fidèlement l’utilisation dans le monde réel. Le risque de demander ce type de commentaires aux utilisateurs est que les personnes sourdes considèrent le langage des avatars comme un autre style de langage qu’elles devront supporter et apprendre à « comprendre » (tout comme elles doivent apprendre à comprendre le langage des interprètes). Cela peut conduire à des réactions socialement souhaitables ».
Il existe également un risque possible que les personnes interrogées dans le cadre des enquêtes soient inconsciemment biaisées : Les personnes interrogées pourraient dire qu’elles ont compris simplement parce qu’elles pensent qu’on attend d’elles qu’elles apprécient cette technologie qui est faite « pour » elles. L’un des problèmes de la recherche dans ce domaine est qu’il n’existe pas de données pratiques fiables : « Il y a une grande différence entre regarder un avatar sur un écran dans son propre bureau pour une courte expérience et devoir le regarder lors d’un rendez-vous médical peut être éprouvant pour les nerfs.
- De Meulder poursuit en évoquant les attentes de la communauté sourde : « Certaines personnes sourdes peuvent avoir de grandes attentes à l’égard des avatars de signature, espérant une solution magique qui pourrait améliorer l’accès. Il est important de gérer soigneusement les attentes et de ne pas surestimer les capacités des technologies de la langue des signes ».
Elle estime toutefois que les gouvernements risquent d’utiliser les avatars comme une solution bon marché sur la voie de l’accessibilité totale : « De nombreuses personnes sourdes craignent que les gouvernements ne choisissent la voie de la rentabilité en optant pour une traduction automatique médiocre plutôt que pour des interprètes humains dans certaines situations, et que les personnes sourdes ne soient forcées d’accepter la traduction automatique dans des situations où elle n’est pas justifiée. Cette inquiétude découle d’expériences plus larges concernant la manière dont les gouvernements et d’autres institutions gèrent la diversité linguistique et le multilinguisme. Nous savons qu’il s’agit d’une pente glissante : les personnes sourdes se sont opposées à l’utilisation de l’interprétation vidéo à distance (VRI) dans les hôpitaux, par exemple, et pourtant l’utilisation de la VRI dans certaines situations médicales est aujourd’hui largement acceptée.
Avatars en langue des signes : Naviguer entre technologie, plaidoyer et préoccupations éthiques
Les avatars en langue des signes ont été critiqués dès 2018, lorsque la Fédération mondiale des sourds (FMS) a publié une déclaration avec l’Association mondiale des interprètes en langue des signes (WASLI) sur l’utilisation des avatars en langue des signes. La principale critique était que les traductions générées par ordinateur ne pouvaient pas atteindre la qualité des interprètes humains, notamment en ce qui concerne les facteurs sociolinguistiques et socioculturels. Les avatars ne devraient jamais être utilisés, en particulier dans les situations d’urgence où les personnes sourdes sont en danger de mort, car la marge d’erreur est trop élevée et – ce qui est un autre point important en soi – il n’y a pas de communication bidirectionnelle avec les avatars. Cela signifie que des informations peuvent être traduites, mais que les personnes sourdes ne peuvent pas répondre ou même demander des éclaircissements. À l’instar des gants en langue des signes, la recherche sur les avatars semble largement ignorer que les personnes sourdes sont, en fait, capables et désireuses de répondre. C’est quelque chose que les avatars ne peuvent pas offrir, même en 2024, six ans après la déclaration commune de la DCE et de la WASLI.
- De Meulder distingue l’utilisation dans les « situations d’urgence » : « Il est important de hiérarchiser les domaines d’application et d’identifier les programmes de recherche qui posent problème tout en laissant de la place à ceux qui ne posent pas de problème. Il existe une distinction entre, par exemple, un avatar qui présente des informations sur une page web gouvernementale et un avatar utilisé pour faciliter la communication dans une situation de soins de santé mettant en jeu le pronostic vital. En établissant des priorités et des distinctions entre les différents domaines d’application, on fera progresser l’état de la technique de telle sorte que les technologies auront plus de chances d’être adoptées par les utilisateurs finaux. Il est également important d’établir des priorités au sein des domaines d’application et de faire des distinctions entre les différentes utilisations par domaine. Par exemple, toutes les applications dans le domaine médical ne sont pas identiques. Certaines peuvent être utiles, par exemple l’enregistrement dans un hôpital, tandis que d’autres peuvent rester à proscrire, par exemple les interventions chirurgicales mettant en jeu le pronostic vital ou d’autres cas critiques. »
En 2019, trois associations autrichiennes ont publié d’autres déclarations déconseillant l’utilisation d’avatars. L’association linguistique Verbal a mis en garde contre l’utilisation d’avatars parce qu’ils feraient ressembler la langue des signes à une langue « artificielle » et priveraient les personnes sourdes, en particulier les enfants, de modèles. Elle réfute le principal argument des partisans des avatars, à savoir que ces derniers constitueraient une solution de traduction moins onéreuse à long terme, en déclarant que les droits de l’homme, comme le droit d’accès à la communication, ne peuvent pas être évalués en termes d’argent. Ils craignent que l’augmentation du financement de la recherche sur les avatars n’entraîne une diminution du financement de la recherche sur la langue des signes et du soutien à la langue des signes autrichienne, qui est un patrimoine reconnu par les Nations unies. L’Association nationale autrichienne des sourds (ÖGLB), comme la WAD et la WASLI avant elle, reconnaît que la recherche et la production d’avatars en langue des signes devraient toujours être dirigées, contrôlées et évaluées par des professionnels sourds. L’ÖGLB se dit préoccupé par le fait que les personnes sourdes deviennent de moins en moins pertinentes pour la représentation de la langue des signes.
Toutes les associations, même l’Union Européenne des Sourds (EUD), s’accordent à dire que les avatars en langue des signes peuvent être autorisés pour des informations non vitales telles que les retards de trains ou les prévisions météorologiques. Elles sont toutefois unanimes dans le sens contraire : Les avatars ne devraient jamais être utilisés pour des informations vitales, par exemple en cas d’urgence ou de catastrophe.
Pour M. De Meulder, il est nécessaire que les défenseurs des avatars appuient leurs arguments contre les avatars par des faits et des recherches : « Les organisations de sourds doivent se préparer à d’éventuels changements perturbateurs causés par les progrès des technologies linguistiques, en particulier la traduction automatique. Je dirais même : regardez l’horizon. Les associations de sourds peuvent contribuer à élaborer de manière proactive des politiques qui anticipent les développements futurs, en veillant à ce que les personnes sourdes continuent à avoir le choix dans la manière dont elles accèdent à l’information. Les associations de sourds (et les associations d’interprètes en langue des signes et les programmes de formation !) doivent également réfléchir à la manière dont cela affectera la profession d’interprète en langue des signes.
Il est désormais clair que l’émergence des avatars, tel un tsunami technologique, ne peut être arrêtée, et que la communauté sourde doit suivre et s’impliquer dans ce développement si elle ne veut pas perdre une fois de plus les avancées en matière d’accessibilité. Cependant, on peut se poser la question de l’éthique de cette implication. Il s’agit en effet d’un problème dans le monde des universitaires sourds ainsi que dans le monde de la politique des sourds.
La communauté sourde et son implication dans le développement des avatars : une position délicate
L’Association allemande des sourds (DGB) est restée silencieuse sur le sujet des avatars en langue des signes, rappelle Ralph Raule, l’actuel représentant des médias et de la numérisation au sein de la NAD allemande. Nous lui parlons de la déclaration préliminaire, publiée à la hâte en 2024, quelques jours seulement après la publication de la deuxième déclaration de l’initiative bavaroise KOGEBA. Ils avaient déjà protesté contre le projet AVASAG en novembre 2023, affirmant que le projet, lancé en 2020, n’impliquait pas les professionnels Sourds aux étapes pertinentes de la production d’avatars en langue des signes.
Plus important encore, ils ont critiqué l’implication de Ralph Raule dans AVASAG, un projet commercial, alors qu’il occupe également le rôle de représentant auprès de la NAD. Ralph Raule, qui a fondé et détient une participation dans une société de production de films en langue des signes, a démenti ces affirmations, de même que tous les partenaires du projet AVASAG. Ils affirment également que, contrairement aux critiques de KOGEBA, des professionnels sourds ont bel et bien participé au projet. C’était en novembre 2023.
Depuis, des documents émanant de municipalités ont fait surface ce même automne, dans lesquels les prix des avatars en langue des signes fournis par Charamel étaient discutés. Plus précisément, le Landkreis Tuttlingen a discuté du financement et de la réalisation de l’utilisation des avatars sur ses sites web. Pour deux ans, 3 750 euros ont été proposés, avec une couverture supplémentaire « gratuite » de deux ans. Le coût s’élèverait donc à 3 750 euros pour quatre ans. Il n’est pas certain qu’il en soit de même à l’avenir. Nous sommes convaincus que nous pouvons réduire le recours à de « vrais » interprètes en langue des signes grâce à l’utilisation d’avatars numériques », peut-on lire dans le document. Les « vrais » (sic !) interprètes en langue des signes sont proposés à 170 euros de l’heure pour deux personnes. Si l’on s’en tient à ce tarif, qui exclut tous les autres frais tels que les frais de transport, on ne peut couvrir qu’environ 22 heures d’interprétation avec le même montant que Charamel facturerait pendant quatre ans. Le journal continue de comparer l’avatar numérique aux fonctions de synthèse vocale déjà mises en œuvre sur leurs sites web. Le journal a également annoncé discrètement l’introduction de ces avatars sur les sites web municipaux à partir du tournant de l’année 2023/2024.
Le gardien du Sud frappe à nouveau
KOGEBA, toujours aussi vigilant, n’a pas raté l’occasion. Dans sa deuxième déclaration, publiée le jour de la Saint-Valentin 2024, elle énumère 23 municipalités utilisant des avatars en langue des signes. Parmi elles figurent Munich, Duisburg, Würzburg et Regensburg, de grandes villes allemandes. En supposant que le prix soit le même pour toutes les municipalités, cela suggère un volume de ventes d’un peu plus de 86 000 €. (En vérifiant avec Charamel, ils nous ont donné une estimation de 1 000 € de frais de licence minimum par an, ce qui semble correspondre aux 3 750 € pour ce qui est effectivement l’utilisation d’un avatar pendant quatre ans). L’Allemagne compte un peu plus de 10 000 municipalités, ce qui représente un volume de ventes potentiel de 37 millions d’euros sur quatre ans, grâce à un concept nettement moins cher que celui des interprètes en langue des signes. Il y a beaucoup d’argent à gagner en développant, en testant et en octroyant des licences pour les avatars.
Après la deuxième déclaration de KOGEBA, l’association nationale allemande des sourds, la DGB, a réagi rapidement et, en collaboration avec l’association nationale des professeurs de langue des signes, l’association nationale des malentendants et l’association des interprètes sourds certifiés, a publié une déclaration déconseillant clairement l’utilisation d’avatars en langue des signes.
Cette déclaration a été présentée par Ralph Raule, le même représentant dont l’implication dans le projet d’avatar AVASAG par l’intermédiaire de son entreprise, yomma, a été critiquée précédemment. Comment ce changement d’avis s’est-il produit ?
D’emblée, Ralph Raule apporte quelques précisions dans un entretien par courrier électronique. Les avatars critiqués dans la deuxième déclaration, à savoir ceux utilisés par le musée Zeppelin de Friedrichshafen, étaient expérimentaux, explique-t-il. « L’idée générale était de tâter le terrain : L’idée générale était de tâter le terrain, de voir ce dont nous avons besoin et à quel point la technologie est avancée, afin de développer plus tard un bon système d’avatars. Ce que l’on peut voir aujourd’hui sur le site web de Zeppelin est purement expérimental et les personnes utilisées pour la capture des mouvements n’étaient ni formées ni certifiées en tant qu’interprètes. « Il était clair dès le départ que ce système ne devait être utilisé qu’après que des professionnels qualifiés aient vérifié qu’il répondait aux normes de production », explique-t-il. « Pour quiconque connaît la langue des signes, il est clair que l’avatar dans cet état n’est pas adapté à la publication. Il insiste à nouveau sur le fait qu’il avait été catégorique sur le fait de ne pas utiliser les vidéos expérimentales sur des sites web publics. « Chez Yomma, nous avons été surpris parce que les séquences de test que nous avons enregistrées ont été publiées pour le Zeppelin Museum. Charamel a agi comme s’il s’agissait d’un produit arrivé à maturité et parfaitement raisonnable ».
Alexander Stricker, propriétaire de Charamel, l’entreprise d’avatars qui vend actuellement ses avatars à des municipalités dans tout le pays, nous explique dans un courriel qu’« il est très important pour nous d’impliquer les utilisateurs finaux dès le début ». Le produit, poursuit-il, « est développé dans le cadre d’une série de processus itératifs, c’est-à-dire continus ». Il se dit « explicitement reconnaissant » pour la deuxième déclaration de KOGEBA qui, selon lui, aide Charamel à améliorer sa technologie.
Interrogé sur la raison pour laquelle la déclaration préliminaire de la NAD est intervenue si rapidement après la deuxième déclaration de KOGEBA, Raule admet que la DGB avait préparé une déclaration dès 2020, mais que la NAD n’en était pas satisfaite parce que la technologie progressait si rapidement. Des discussions ont eu lieu avec KOGEBA en décembre 2023. Raule raconte que KOGEBA lui a demandé pourquoi il n’avait pas encore publié sa déclaration et si c’était à cause de sa double implication dans la yomma/AVASAG et la DGB. « Cette question m’a incité à reconsidérer ma position et à terminer cette déclaration ». Il précise que la déclaration est le fruit du travail de quatre associations majeures et qu’à ce titre, elle implique une formulation très spécifique. La déclaration est étroitement liée à leurs tentatives de créer une ligne directrice unifiée pour les normes de qualité de la langue des signes dans les médias et la traduction. Les progrès de la technologie des avatars ont mis la pression pour que la déclaration soit adoptée, explique M. Raule. « De nombreux fonctionnaires semblent penser que les avatars sont la solution miracle pour l’accessibilité des personnes sourdes, sans demander à la communauté sourde ce qu’elle pense des avatars. »
Depuis que le projet d’avatar municipal a été rendu public, de plus en plus de journaux rapportent qu’il sera bientôt possible d’utiliser l’IA pour traduire la langue écrite ou parlée (auditive) en langue des signes. Interrogés à ce sujet, les journalistes (entendus sans aucune formation en langue des signes) impliqués dans ces articles ont révélé qu’ils se référaient spécifiquement au projet municipal d’avatar, celui-là même qui a été critiqué par KOGEBA et dont l’aptitude à la production a été refusée. Nous avons demandé à Alexander Stricker de Charamel s’il avait été précisé à Yomma que le matériel expérimental serait utilisé dans des scénarios réels. Stricker a répondu que les résultats de la recherche du projet AVASAG, initié par Charamel et auquel yomma, parmi d’autres partenaires, a participé, pouvaient être utilisés par n’importe quel partenaire du projet. Ce point a été clarifié dans un contrat « approfondi » entre tous les partenaires.
Résumé et perspectives : Où allons-nous maintenant ?
Il suffit de regarder les progrès réalisés depuis les premières sorties de vidéos générées par l’IA en 2023 jusqu’à la génération vidéo Sora AI de 2024 pour constater que les avancées technologiques ont été extrêmement rapides. Les traductions de langues écrites comme DeepL, grâce aux progrès de l’IA, sont également devenues très fiables. Il n’est pas impossible que l’IA soit utilisée pour améliorer l’interprétation automatique de la langue des signes par le biais d’avatars, même si la plupart des gens semblent sceptiques à ce sujet et que l’effet « uncanny valley » (vallée étrange) que beaucoup associent aux avatars de la langue des signes doit être pris en compte.
Depuis les débuts des « avatars » Memoji avec l’iPhone X d’Apple, il est devenu clair que le suivi des mouvements sans combinaison de capture de mouvement complète ni technologie spécialisée est possible pour les utilisateurs ordinaires. L’introduction récente par la société californienne de « personas », qui sont essentiellement des avatars conçus individuellement pour une utilisation dans le chat vidéo lorsque le nouveau casque Vision Pro est utilisé, montre qu’il est possible de copier la plupart des mouvements et des formes de main très précisément, contournant presque l’effet de la vallée étrange (uncanny valley).
Si l’on s’éloigne de l’aspect interprétation, cette technologie générale a également d’autres utilisations, comme le montrent les recherches de la RWTH Aachen sur l’anonymisation par le biais d’avatars en langue des signes. La langue des signes anonyme est pratiquement impossible, mais les avatars – ou « personas » personnalisables, comme le dit Apple – pourraient fournir une couche de secret ou de neutralité aux présentateurs en langue des signes. Étant donné que les avatars sont surtout utilisés pour réduire les coûts, il est peu probable qu’ils soient financés et qu’ils gagnent en popularité. Encore une fois, comme l’a dit l’association autrichienne Verbal, les droits de l’homme ne peuvent pas être mis en balance avec l’argent – c’est ce qu’il faut retenir de la question des avatars et on peut voir qu’il y a beaucoup d’argent à gagner en fournissant des « services d’interprétation » à un coût beaucoup plus bas.
- De Meulder estime que les chercheurs sourds sont confrontés à un défi particulier. D’une part, ils sont obligés de se montrer sous leur meilleur jour dans un environnement où se trouvent des chercheurs entendants et, d’autre part, ils doivent faire face à des déséquilibres de pouvoir et de communication : « De nombreux chercheurs sourds ont été sollicités pour collaborer à des projets d’IA en langue des signes, souvent bien après que l’idée a été conçue, l’équipe constituée, la recherche menée ou même la rédaction du projet. Cela crée souvent un cercle vicieux pour les chercheurs sourds, car les technologies seront développées et la recherche sera publiée sans que nous soyons impliqués, alors que le fait d’être impliqué peut impliquer une approbation. »
Actuellement, De Meulder rappelle 10 projets de recherche depuis 2015, tous ayant reçu un financement de l’Union européenne à hauteur de près de 26 millions d’euros. Comme pour la plupart des technologies, le développement est motivé par des raisons économiques : « Il en va de même pour les technologies de la langue des signes, même si les incitations économiques peuvent différer en raison de la taille plus réduite du marché. Mais elles sont toujours importantes et n’ont pas seulement pour but de générer des profits, mais aussi de réduire les coûts ». Pour elle, cela ne va pas nécessairement à l’encontre des droits de l’homme et de l’accessibilité, mais il faudrait plutôt réfléchir à la manière de « tirer parti de ces technologies pour améliorer l’accès des personnes sourdes, et ne pas se contenter de les mettre en balance avec leurs incitations économiques ».
Le débat sur les aspects éthiques des avatars en langue des signes se poursuit. Le principal danger pour la communauté sourde réside dans le risque de compromettre l’intégrité de la langue des signes et de la culture sourde. Les avatars en langue des signes pourraient potentiellement dégrader la qualité et l’authenticité de la langue des signes, en la rendant artificielle ou en éliminant des aspects culturels et sociolinguistiques importants. En outre, l’utilisation commerciale de cette technologie suscite des inquiétudes, car elle pourrait être motivée par des intérêts économiques plutôt que par des considérations éthiques et sociales visant à améliorer l’accessibilité pour la communauté sourde. En fin de compte, si les avatars en langue des signes ne sont pas développés de manière responsable, avec une participation significative de la communauté sourde elle-même et en accordant une attention particulière à la préservation de la langue des signes et de la culture sourde, ils pourraient potentiellement causer plus de tort que de bien.