Apertus | La Suisse propose au monde une IA qui parle même le romanche
19.12.2025 – Stéphane Herzog
Les deux écoles polytechniques suisses et leur partenaire ont lancé en septembre le modèle de langage Apertus. Ce système a été entraîné sur des mots puisés dans 1800 langues, dont le suisse allemand et le romanche. Apertus est critiqué pour ses erreurs. Des spécialistes estiment qu’il faut lui laisser du temps.
Antoine Bosselut, de l’EFPL, souligne la transparence du modèle d’IA suisse Apertus. L’idée est «de démocratiser» l’IA. Photo MAD
Nous cherchons notre chemin à travers les avenues piétonnes du campus de l’Ecole polytechnique de Lausanne (EPFL). Nous avons rendez-vous avec Antoine Bosselut, spécialiste de l’intelligence artificielle et des questions multilingues dans les Large Language Models (LLM): «les grands modèles de langage». Ces systèmes d’intelligence artificielle nourris de milliards de données sont capables, à l’instar de ChatGPT, de répondre à une infinité de questions. Né en France, formé aux États-Unis, ce professeur de 34 ans en connaît un bout sur les moyens de créer des machines capables de maitriser des idiomes aussi différents que le tibétain ou le romanche. C’est l’un des pères de la nouvelle IA suisse: Apertus.
Début septembre, les deux écoles polytechnique suisses et le Centre suisse de calcul scientifique (CSCS) ont annoncé la sortie du premier LLM multilingue en open source développé en Suisse. «Apertus représente une étape majeure pour la transparence et la diversité dans l’intelligence artificielle générative», avancent ses géniteurs. En quoi ce LLM serait-il différent de Llama 4 (développé par Meta), Grok (produit par Elon Musk) ou encore ChatGPT, qui est en fait un système d’IA complet? Les éléments qui constituent la machinerie suisse – ses algorithmes et ses paramètres de calcul – sont accessibles librement. Le mode d’emploi est fourni, alors que, par exemple, ChatGPT demeure un modèle commercial opaque. Autre différence, Apertus n’est pas un système généraliste. «Les modèles commerciaux ne sont pas assez spécialisés pour certains usages particuliers, or plus une IA est spécialisée, plus elle est forte», explique Antoine Bosselut. Des hôpitaux pourraient se servir de l’outil Apertus – de ses algorithmes, de son système de calcul – pour entraîner le système à effectuer des analyses sur des milliers de radiographies. L’IA est capable, en comparant des données, de détecter des différences peu visibles à l’œil.
La quête de données sûres
Le super ordinateur du CSCS a entraîné Apertus au moyen de milliards de données puisées sur Internet. Elles constituent le lexique de base des LLM. Pour ce modèle, seules ont été prises en compte des données dont les propriétaires n’interdisent pas explicitement l’utilisation de «crawlers», ces robots qui moissonnent le web, précise l’EPFL. «Si, par exemple, le New York Times interdit l’accès à ses articles à certains crawlers, nous excluons cette source de nos données», indique le professeur. L’entrainement d’Apertus s’est basé sur 15 milliards de mots captés sur 1800 langues (Internet recelant quelque 50’000 milliards de mots). Dans ce cas, les créateurs de ce LLM garantissent aux futurs utilisateurs – par exemple des entreprises – la fiabilité des données au sens éthique et juridique du terme, là où les acteurs commerciaux de l’IA refusent de publier leurs données d’entrainement.
En général, les grands modèles se focalisent sur les langues historiques d’Internet – l’anglais, le français, le chinois, le japonais, etc. Avec leurs calculateurs et leurs algorithmes, ils décodent leurs structures. Or cette fois, le LLM suisse a cherché des données auprès d’idiomes peu présents sur Internet comme le tibétain, le yoruba, le suisse allemand et même le romanche! Mais ces langues étant peu «parlées» sur Internet, il a fallu créer des contenus à partir de langues voisines. L’idée est que le modèle pourra apprendre le romanche malgré la rareté des données, parce qu’il est également entraîné sur l’italien et qu’il existe des similitudes entre les deux langues, précise Antoine Bosselut. Pour quoi faire? Apertus a par exemple été adopté par une école au Nigeria, qui peut ainsi développer des cours en se basant sur une langue généralement peu présente dans d’autres modèles. Cela répond à la volonté de l’EPFL de «démocratiser l’IA».
La Ville de Zurich utilise Apertus
Pour mûrir, le LLM suisse a été soumis à des cracks durant des «hackathons», sortes de concours servant à tester des systèmes. Des étudiants ont utilisé cet outil pour créer des services. Voilà une interface qui facilite l’apprentissage de la langue tibétaine. Des petits malins on produit un système nommé «Mut zur Lücke» (le courage d’avoir des lacunes). Il indique aux étudiants quelles parties de leurs cours ils peuvent ignorer sans risquer d’échouer. La Ville de Zurich utilise aussi Apertus. «Je suis ZüriCityGPT et je sais (presque) tout sur ce qui est publié sur le site de la ville», annonce ce site. Avec des limites. Combien la municipalité compte-t-elle de policiers armés? Apertus ne peut «malheureusement pas vous aider», répond le robot. GPT est un peu plus malin.
«Environ 1700 agents sont concernés par le port d’une arme de service, mais aucune source publique ne précise combien portent effectivement une arme en permanence», formule cette IA. Fait surprenant, Apertus a été livré sans interface permettant aux utilisateurs de rédiger des «prompts».
Ce n’était pas le but: le LLM est là pour servir de matière première, indiquent ses créateurs. Cependant, chacun a pu aller tester Apertus à travers un logiciel – publicai.co – développé par une organisation américaine à but non lucratif.
Des erreurs et des critiques
En Suisse, les premiers commentaires sur Apertus se sont cristallisés sur des erreurs grossières. «J’apprends que le château de Chillon était à l’origine un petit village fortifié sur un rocher calcaire au milieu du lac», s’est moqué sur Linkedin le journaliste romand François Pilet, l’un des fondateurs du site d’investigation Gotham City. Qui s’étonne du rapport qualité-prix de l’opération. «Alors que les EPF viennent de tripler les taxes pour les étudiants étrangers, elles n’ont pas hésité à dépenser 10 millions de francs pour financer ce qui s’avère être une performance d’art contemporain!», raille-t-il.
Cette attaque a fait réagir des Internautes, comme Maxime Derian, expert français en intelligence artificielle. «Les modèles open source américains et chinois ont un temps d’avance. Et alors? Les premiers modèles de ces pays étaient eux aussi très imparfaits. Votre modèle suisse est local. Les versions suivantes seront améliorées et finiront par être pertinentes d’ici deux à trois ans», prédit cet entrepreneur. Si Apertus fait des erreurs, c’est que le modèle n’est pas encore assez entrainé et manque encore de données. Antoine Bosselut va dans le même sens: «Nous avons assumé la part la plus chère du travail, qui consiste à construire et à entrainer le modèle. Celui-ci est désormais accessible gratuitement pour les futurs utilisateurs», défend le professeur de l’EPFL.
Commentaires