Webinaire DataGrandEst
Le 23 Avril 2024

IA et data dans les territoires : de quoi parle-t-on ?

               

Publié sur le 23/04/2024

 

La génération née après l’an 2000 n’imagine pas un monde avec un téléphone fixe, un minitel ou encore une connexion internet à quelques kilobits par seconde (kbps). La révolution numérique que nous vivons touche tous les secteurs économiques et de nombreuses disciplines.
Les développements de l’Intelligence Artificielle (IA), en particulier le « big data » et le « deep learning » permettent à la machine de surpasser l’opérateur humain pour certaines opérations. Le développement du cloud, des objets connectés ou encore de la 5G laissent présager que le volume total des données créées dans le monde devrait atteindre 175 zettaoctets (175 milliards de teraoctets) en 2025. L’innovation est avant tout une innovation d’usage (individuel ou collectif) et une innovation de modèle. L’IA est en train de transformer le monde de l’entreprise et du "travail", notamment avec les dernières évolutions autour des IA génératives. Elles requestionnent nos fonctionnements en permettant d'optimiser certaines tâches, souvent à faible valeur ajoutée.
De quoi parle-t-on exactement ? Comment l'IA tend aujourd'hui à impacter les politiques publiques ? Que pourrait-elle apporter demain à nos organismes ? Comment la prendre en compte et initier des démarches adaptées au sein de nos structures ?Nous avons tous conscience de l'omniprésence des données dans notre quotidien pour chercher un commerce ou un itinéraire depuis nos smartphones. En activant l'historique de nos positions sur nos mobiles, notre quotidien est même capté par certaines plateformes.

Intervenants

  • Jacques PRIOL (Président du cabinet CIVITEO, Président de l’Observatoire Data Public Expert associé auprès du Partenariat mondial pour l’intelligence artificielle)
  • Clément CAMBON (Délégué à l'Innovation et à la Modernisation de l'Action Publique - DIMAP)

 

A noter : les présentations ci-dessous sont diffusées à partir de la chaîne YouTube DataGrandEst. Si vous rencontrez des difficultés pour les visionner, nous vous invitons à utiliser les liens mentionnés dans la rubrique "Document (lien) plus bas sur cette page"

 

Regarder le webinaire complet

 

 

Ou choisir une vidéo selon l'intervention

 

Après la folie ChatGPT, quels usages de l’IA au service des politiques publiques en 2024 ?
Jacques PRIOL (Président du cabinet CIVITEO, Président de l’Observatoire Data Public Expert associé auprès du Partenariat mondial pour l’intelligence artificielle)

 

Jacques Priol présente les utilisations actuelles de l’Intelligence Artificielle (IA) dans le secteur public et les notions à connaitre en 2024. Il aborde les questions qui se posent notamment en lien avec la protection des données, les droits d’auteurs, l’empreinte écologique ou les erreurs qu’il faut comprendre et intégrer (ex : cas des faux positifs Vs la plue-value générée). La France œuvre pour l’utilisation de l’IA dans un contexte cadré, traçable, éthique et respectueux (sont abordés l'IA act, l’exemple d'Ekitia et demain peut-être un futur label IA frugal). Vous retrouverez dans cet exposé différents exemples d’utilisations concrètes dans les collectivités françaises. En 2024, accompagnant l’arrivée massive de l’IA générative (et ses outils capables de simuler des formes d’expression, des textes, des photos et des vidéos avec beaucoup de vraisemblance), un foisonnement de projets sont recensés sur les domaines de l’environnement de l’eau, de l’énergie, de l’aménagement du patrimoine ou encore de la gestion des déchets. L’accent est porté sur la donnée et son importance dans les usages, les outils et les chaînes de traitement.

 

C'est une question clé qui est au cœur d'un certain nombre de contentieux et de procès qui se préparent aux États-Unis, notamment sous l'impulsion d'artistes et d'ayants droits. Ils essaient d'inverser la charge de la preuve en demandant aux concepteurs des IA de prouver que les résultats ne s'appuient pas, au moins en partie, sur des œuvres dont ils détiennent des droits.
L'équation ainsi posée semble insoluble à ce stade.
C'est aussi un sujet au cœur de la polémique sur la position française concernant les négociations de l'IA Act européen. Il y a une dissonance entre la position habituelle de la France sur « l'exception culturelle à la française » et les enjeux liés au développement des IA européennes. En d’autres termes, faut-il privilégier la protection des droits et la régulation, ou libérer plus fortement l'innovation ?

On sait qu'un jeu de données, même anonymisé, s'il est croisé avec d'autres données peut permettre de la ré-identification. C'est le rôle notamment des DPO de veiller à ce que cela n'arrive pas.
L'IA ajoute de la complexité dans le traitement de nos données. Deux points essentiels :

  • Pour contextualiser une demande, l'IA peut potentiellement utiliser des données et informations (personnelles) de l'utilisateurs / agent public.
  • Pour répondre à des problèmes de plus en plus complexes, on va utiliser des volumes de données de plus en plus important avec un risque accrus de ré-identification par l'IA lors de la manipulation de ces informations. Ce sujet est par exemple au cœur de la manipulation des informations et de l'utilisation de l'IA pour la prévention en matière de santé.
  • C'est pourquoi, par exemple, les citoyens réunis à Montpellier il y a quelques semaines pour travailler sur les usages de l'IA ont identifiés 2 conditions à son utilisation : le service public n'alimente pas l'IA par de la donnée personnelle (uniquement « robustement anonymisée ») et quand ils ont recours à l'IA, les pouvoirs publics fasse systématiquement une étude d'impact sur les risques et conséquences possibles. Cela est d’ailleurs prévu par le RGPD.
    A cette occasion, il a été indiqué par la CNIL que l'on ne pouvait pas certifier à 100% que les IA et les LLM notamment sont en conformité avec le RGPD.

A ce jour il n'existe pas, à priori, de sourcing des IA souveraines. Des entreprises françaises développement des solutions et certaines sont mises à l'honneur dans les médias (ex.: dans le cadre des jeux olympiques).
De là à dire que ces solutions sont souveraines c'est une vrai question…
Comment qualifier la nature souveraine de l'IA ? Par exemple si une entreprise française qui développe et propose une IA de gestion de l'éclairage public qui a été entrainée sur des données de villes américaines, est-elle réellement souveraine ?
De même, en matière de vidéo surveillance, si les systèmes embarqués ont été entrainés dans des villes chinoises, peut-on parler d'IA souveraine, quand bien même c'est une entreprise française qui utilise un algorithme qui aura bénéficié d'un « fine tunning » et d'un réapprentissage local ?
Ce sont des sujets qui ne sont pas simples. La souveraineté c'est à la fois le code (et sa licence - l'open source par exemple peu représenter une forme de souveraineté), les algorithmes, les données, le modèle économique, etc.

C'est un sujet important, car chaque collectivité ne peut pas contrôler et vérifier chaque solution, sachant qu'actuellement, l'offre augmente très rapidement.
Aujourd'hui, il y a quelques labels d'IA de confiance qui existent, destinés notamment au monde industriel ou de la santé. Concernant la sphère territoriale, il y a un label mis en place par Ekitia sur la data et l'IA qui repose sur un certain nombre de vérifications réalisées par un auditeur externe indépendant. Il y a 5 programmes qui ont été labélisés à titre expérimental, dont l'IA de la Région Occitanie sur la formation professionnelle et les demandeurs d'emplois.
Ce type de démarche va donc sans doute se développer rapidement. Il y aura par exemple des labels de type « IA frugale » (moins consommatrice possible d'énergie) qui devraient apparaitre dans les mois à venir.

Le sujet de l'IA frugale est avant tout une question d'optimisation de l'utilisation des ressources pour disposer d'un résultat correct et répondant au besoin.
Limiter l'apprentissage à des données, utiles, locales, représentatives de l'usage attendu est une piste. Cela peut par ailleurs renforcer le caractère souverain de la solution utilisée. Cependant, les travaux sur l'IA frugale ne sont qu'à leur début.

C’est un point important car le Ministère de la transition écologique a lancé des appels à projets pour construire des démonstrateur d'IA territoriale au service des transitions. Or, il exige qu'il y ait une mesure qui soit réalisée sur l'impact environnemental des usages de l'IA.
Des outils existent. Par exemple, l'ADEME a mis un en place une solution il n'y a pas très longtemps. Pour sa part, jusqu’à présent, le Ministère utilise « Green Algorithms » pour mesurer l'empreinte carbone des processus d'apprentissage et d'utilisation des algorithmes.
Cela reste pour le moment des outils relativement sophistiqués, mais qui vont se démocratiser.
Il est à noter que faire fonctionner une IA localement sur une quantité mesurée de données peut être beaucoup moins impactant environnementalement (quelque grammes ou kilogrammes de CO2) que faire tourner des IA avec du Big Data sur des super calculateurs situés outre-Atlantique (quelques tonnes de CO2).
L'empreinte carbone et la consommation énergétique des IA n'est pas quelque chose d'anodin. C'est un réel enjeu pour les collectivités si on généralise ces outils. La question des IA frugales est un sujet d’avenir.

Plusieurs projets sont portés par la DINUM au niveau national, notamment le projet « Albert », sorte de Chat GPT entrainé par et pour les administrations. Il est décliné aujourd'hui dans des versions opérationnelles à l'Assemblée Nationale et dans des universités. Quelques collectivités l'utilisent aussi en test.
Ces outils reposent sur des corpus d'entrainement souverains. Les moteurs par contre sont variés. Certains utilisent la solution proposée la société française Mistral qui avec des moyens financiers bien moins importants, vise à concurrencer les géants du secteur.
Ces outils existent et sont accessibles modulo une prise en main relativement experte. Il est fort probable que d'ici quelques mois il existera de nouvelles déclinaisons de ces solutions ré-entrainées avec des données spécifiques pour répondre aux besoins locaux.

Cette grille sera prochainement disponible, au moins en partie, via une publication réalisée ces dernières semaines pour l'Observatoire international du numérique et de l'IA .
Elle a été présentée notamment lors d’une restitution scientifique en début d’année à l’École Normale Supérieure (Voir la vidéo).

La Métropole de Nantes a été l'une des premières collectivités à travailler sur ce sujet.
Cet algorithme a ensuite été repris par d'autres collectivités territoriales comme Toulouse Métropole.

Il y a différentes entreprises qui propose ce type de service.
On peut citer par exemple une filiale du groupe La Poste : « Geoptis ».
A noter aussi que Grand Paris Seine Ouest (GPSO) a mis en place en 2022 un partenariat avec Vialytics, Neovia et le Cerema sur ce sujet. Le Département de la Haute Garonne a également réalisé des tests pour la gestion de ses routes.

La slide récapitulative présentée par Jacques PRIOL s'appuie principalement sur des cas d'usage portés par des collectivités. Or, ces dernières interviennent principalement en périphérie du thème de l'éducation. C’est d’ailleurs un sujet extrêmement sensible, politique et débattu. Certaines entreprises envisagent grâce l'IA de proposer des corpus d'apprentissage qui pourraient remettre en cause, voire remplacer certaines formes d'enseignements. Ce sont des sujets qui font polémique et pose aujourd'hui des questions fondamentales sur les contenus et les systèmes d'apprentissage.
C'est la raison pour laquelle l'Éducation Nationale allemande a fait désinstaller Microsoft Office 365 de l'ensemble des postes la concernant. C’est une approche défensive. Par contre, dans les pays ou le système éducatif est peu développé et structuré, certains fondent de grands espoirs sur l'IA pour développer l’éducation de la population.

Il s'agit ici des collectivités ayant répondu à l'enquête Data Publica en 2023. Ce qui est notable c'est surtout la progression de 12% sur un an entre 2022 et 2023.

 

 

Comment la Région Grand Est s’empare de l’IA pour répondre à ses missions de service public ?
Clément CAMBON (Délégué à l'Innovation et à la Modernisation de l'Action Publique - DIMAP)

 

Clément Chambon présente dans son intervention l’approche de l’IA à la Région Grand Est. Le mot d’ordre est « accompagné le changement plutôt que le subir ». Fort des constats, la stratégie actuelle cible en premier deux objectifs : l’accompagnement des utilisateurs et la dataculturation. Des expérimentations sont aussi réalisées en suivant des protocoles spécifiques. Ils sont ciblés sur des cas d’usage ayant le potentiel de passer à l’échelle. De nombreux agents commencent à s’emparer des outils disponibles : Accompagnés et formés, ils deviennent alors des ambassadeurs IA dans la collectivité. La Région se positionne donc dans une dynamique pro-active, que cela soit dans le développement de projets, dans la formation, dans l’accompagnement au changement ou dans l’anticipation de la massification des outils disponibles. Il rappelle, comme Jacques Priol, que les données sont la composante essentielle en IA : Et dans ce contexte, Data Grand Est est le catalyseur pivot en devenir.

 

Des travaux ont été conduits sur du « sourcing RH », sur l'utilisation des données de la Région et de Pôle Emploi pour identifier les besoins de formations et de les localiser, afin de construire des formations en adéquation avec les profils des demandeurs d'emploi.
La Région a aussi travaillé sur des usages interne autour de la production et gestion de notes pour les élus, ou sur la gestion du support informatique.

La démarche présentée ici concerne en effet la stratégie de transformation interne à la Région en matière d'IA.
Le lien data et IA fait partie des enjeux d'évolution de DataGrandEst, mais également des questionnements. Ce webinaire est en quelque sorte une première sur le chemin du rôle qu'aura à jouer DataGrandEst sur ce sujet. Aujourd'hui on est très centré sur la data et on va poursuivre sur cette voie avec l'évolution de la plateforme dans les mois à venir, mais les sujets d'IA sont intrinsèquement liés à la data, C'est peut-être la prochaine grande étape d'évolution de DataGrandEst pour mieux accompagner les territoires.
A noter aussi qu'au sein de la Région, une Direction accompagne la transformation numérique sur les territoires. L'IA fait partie des sujets actuellement discutés dans cette démarche. Enfin, on peut citer le « Plan IA » mis en place en 2020 par la Région (Voir aussi : https://www.grandest.fr/vos-aides-regionales/aide-aux-entreprises-primo-utilisatrices-dint...).

L'objectif, dans les prochains mois, est de créer un « cadre » (ex. charte) autour de l'IA et de le diffuser pour accompagner le changement. La formation fait aussi partie des actions essentielles pour faciliter l'appropriation de l'IA et améliorer son usage.

Ces éléments seront transmis en interne à la Région en temps utile à l'ensemble des agents de la collectivité. Pour toute demande de précision, n’hésitez pas à contacter Anne HEUPEL (DIMAP).

A ce jour, la démarche se met en place. Si des résultats issus de l'IA sont utilisés, ils seront naturellement identifiés selon le cadre et les règles établis au sein de la collectivité en accord avec les bonnes pratiques et conditions légales d’usage de l’IA.

Oui, l'objectif est d'accompagner les usages. Il est nécessaire aujourd'hui de s'approprier ces outils pour ne pas subir le changement qui est en train de s’opérer et qui sera de toute façon inévitable au sein de notre société.
Certaines études montrent que 50% des gens qui utilisent de l'IA générative ne le déclare pas à leur employeur (secteur public et privé confondu). Pour réduire ce taux, une piste est de former les personnes concernées et les faire monter en compétence plutôt que de les contraindre ou d'interdire.
C'est aussi l'occasion de les former sur le sujet de la donnée : qu'est-ce que l'on peut communiquer ou non ? Pourquoi ? Comment ? etc.

Oui, des démarches d'acculturation sont également prévues auprès des élus. Le programme et les actions à mettre en œuvre sont en cours de définition et discussion.
Certains élus sont déjà sensibilisés, mais il y a un vrai enjeu à élargir ces démarches à l'ensemble des décideurs de la collectivité, autant sur l'IA que sur la data. Une prise de conscience est nécessaire sur les impacts de ces évolutions car elles vont fortement transformer le service public dans les années à venir.

Les agents de la Région Grand Est qui souhaitent intégrer la communauté des « IAventuriers » peuvent contacter directement en interne Anne HEUPEL ou Clément CAMBON de la DIMAP.