Directeur de recherche à l’Inria, Gaël Varoquaux chapeaute une vingtaine de chercheurs spécialisés dans le machine learning (ML) appliqué à des domaines comme la santé, la banque et l’assurance. Il présente les enjeux économiques autour des systèmes d’IA.
Gaël Varoquaux (Inria) : "Les décisionnaires perdent à se laisser fasciner par ChatGPT et ses équivalents"
Décideurs. Les systèmes d’IA sont de plus en plus performants. De telle sorte que la capacité de "réponse" des algorithmes semble s’approcher de celle des individus. Pensez-vous que l’humain sortira de la boucle ?
Gaël Varoquaux. Une prise de décision automatique et parfaite n’existe pas. Une décision majeure dans la vie d’individus dépend de valeurs sociales et de société, d’arbitrage, de compromis ou encore de risque. Le besoin de nuance exige de retourner vers l’humain, tant pour une décision du quotidien, que pour une réflexion professionnelle qui appelle une connaissance de fond.
En règle générale, l’informatique répond à des questions métier. Il est utile d’avoir entrepris soi-même les choses. En informatique appliquée notamment, le product manager effectue les allers-retours entre les ingénieurs et les utilisateurs pour permettre d’aboutir à la meilleure vision produit.
Votre projet Scikit-learn développe des applications d’IA. Pour vous, comment s’élabore cette "vision produit" ?
Les développeurs de Scikit-learn (pour "Scientific Kit and Learn") et moi-même allons à la rencontre de professionnels pour qui l’IA ferait une différence, notamment des directeurs de structures, publiques ou privées. J’apprécie tout particulièrement de parler aux gens qui ont les mains dans le cambouis, aussi bien les chief data officers de géants tels qu’Axa et BNP Paribas Cardiff, qui ont acquis un certain recul, que les data scientists, croisés au hasard de meet-up parisiens, confrontés aux "pain points" du quotidien.
Grâce à ce feedback et après les nombreuses étapes de programmation, les développeurs de Scikit-learn restituent leur raisonnement autour des données pour que nous reformulions et explorerions des pistes d’amélioration. Souvent, un questionnement gagne à être abordé sous un autre prisme. Dans mon autre domaine de prédilection, celui de la santé, je travaille avec des médecins hospitaliers et des cliniciens pour redéfinir des problèmes de santé en problématique de données.
Au-delà des frontières, l’IAG fascine. Quelles limites observez-vous ?
L’IA n’est pas une baguette magique. Elle n’échappe ni aux biais cognitifs de base, ni aux intérêts économiques. Plus on monte dans la chaîne décisionnaire, moins les interlocuteurs se rendent compte de la limite de leur vision. Ils sont ciblés par des stratégies marketing qui ne disent pas leur nom et dont l’enjeu commercial est de vendre une plateforme avec des fonctionnalités.
La création de demande de consommation repose sur les plus gros objets. Faire une démonstration de ChatGPT, ou autre LLM ("Large language models"), est bien plus simple que d’évaluer le modèle d’IA adéquat et de savoir où l’insérer dans un cycle de production pour en tirer la meilleure valeur ajoutée. Les décisionnaires perdent à se laisser fasciner par ChatGPT et ses équivalents.
ChatGPT "parle" à tout le monde grâce à son langage naturel. Toutes les industries gagneraient-elles à s’en saisir ?
L’IA générative constitue une révolution en matière d’expérience utilisateur. Le potentiel est fantastique. Toutefois, il ne correspond pas à tous les usages professionnels. Dans le cas d’une IA de maintenance prédictive qui signale quel robot a plus de chance de tomber en panne, par exemple, les interlocuteurs sont restreints. Ceux qui interagissent et portent un regard critique sur l’IA sont des spécialistes des robots et de la chaîne de logistique. Leur langage est tout sauf "naturel", et l’interface doit le refléter. De même, avec des IA au profit d’équipes marketing, il faut un registre en adéquation avec leurs compétences. On en revient au lien entre le métier et les algorithmes.
En matière d’IAG, quels bonds de valeur sont en ligne de mire ?
Une grande valorisation s’enclenchera quand Google intégrera la technologie d’IAG à nos téléphones, par exemple pour la gestion d’agenda. Ce sera utile pour tout le monde. Quant aux entreprises, ce sera quand une IA embarquée dans Word révolutionnera le travail de secrétariat au sens très large du terme.
"Une grande valorisation s’enclenchera quand Google intégrera la technologie d’IAG à nos téléphones, par exemple pour la gestion d’agenda"
Le bon fonctionnement de ces outils exigera de grands facteurs d’échelle, autrement dit d’énorme jeux de données. La consolidation de tels outils en ligne par de très gros acteurs doit nous inquiéter. À titre individuel, c’est un scénario que nous avons connu lors du choix d’adresse mail. L’offre Gmail, pour fantastique qu’elle soit, nous a fait perdre la main sur la confidentialité de nos e-mails. C’est d’autant plus frustrant qu’il n’y avait pas d’autre option évidente.
Quels écueils anticipez-vous ?
Les entreprises, dans une logique de compétitivité, seront enclines à sous-traiter les processus de secrétariat. En masse, cette décision entraînerait une déperdition de secteurs de l’économie. La perte d’outil implique une perte de contrôle stratégique.
Dès maintenant, la France doit se poser la question en matière de stratégie économique et de rapport internationaux. C’est une réflexion en cours. L’État français a proposé un outil doté d’un LLM pour aider les fonctionnaires à répondre aux mails. Celui-ci est mis en œuvre par la direction interministérielle du numérique.
Quelles pistes discernez-vous pour encourager cette économie ?
Tous les acteurs ne pourront pas élaborer leur propre IA à partir de zéro. C’est plutôt un fine-tuning qui s’envisage, c’est-à-dire un affinement des algorithmes. Dans ce combat économique, il sera indispensable de développer des "communs numériques". D’une part, bâtir une application pour un usage commun fait sa robustesse. Riche de ce constat, j’ai créé en 2009 le projet Scikit-learn [abréviation de "scientific kit and learn", ndlr], pour proposer des solutions robustes et partagées à ceux qui, comme nous, avaient identifié l’inefficacité de recoder les algorithmes classiques à chaque fois. Ce qui, d’autre part, puisque nous parvenons à fédérer une réelle communauté, permet de mutualiser les coûts.
"Dans ce combat économique, il sera indispensable de développer des "communs numériques" "
L’aspect crucial de cette piste est l’open source, les logiciels libres de droit, tout particulièrement dans le cas d’algorithmes "communs". Une chaîne économique de logiciels disponibles en open source peut non seulement mutualiser les coûts, mais soutenir une progression écosystémique. Dès lors qu’un fournisseur devient un parmi d’autres, les clients sont en mesure de faire des achats raisonnés. On évite tout scénario de « lock in », [où les fournisseurs capturent leurs utilisateurs du fait d’une position proche du monopole, ndlr]. C’est le cas sur les serveurs Linux, par exemple, qui entretiennent une compétition saine.
Propos recueillis par Alexandra Bui