Activités de Recherche / Travaux de recherche de Guillaume GUERARD. Projets, séminaires, colloques, conférences, encadrements de stage, toutes l’actualités des activités de recherche.

Voir le profil Scholar

Voir le profil Publons

Encadrements de Thèses

  • Loup-Noé LEVY : 2020-2023 CIFRE Energisme
  • Ihab TALEB : 2021-2024 H2020 MAESHA

CST

  • 2023 – 2026 : Quand Phu NGUYEN, EPHE, John van Neumann Institute HCM – A Machine Learning-Based Approach for Convenient, Rapid, and Precise Source Tracing of Questioned Documents
  • 2021 – 2024 : Thanh Nam TRAN, EPHE, NTU Singapore – Multi-agent deep reinforcement learning approach for Airport Surface Movement Problem
  • 2021 – 2024 : Tuan Minh NGUYEN, EPHE – Study of multilevel opinion dynamics for decision making support system using mathematics and statistical physics methods
  • 2021-2024 : Loc TRAN, EPHE – Hypergraph clustering method
  • 2019-2022 : Laureen DEMAN, Rhones-Alpes – Optimisation économique de l’usage de barrage hydrolique
  • 2018-2021 : Tuan TRAN, EPHE – Approche bayésienne et apprentissage pour la modélisation d’une classe de problèmes économiques et leur application en finance
  • 2017-2020 : Mahdjouba AKERMA, INREA – Méthodes boites blanches et boites noires pour la prédiction de la consommation énergétique

Séminaires et Colloques

Encadrements de Master Thesis

2023 – 2024

  • Lucas AUFFRET et Maximilien STRIEBIG, analyse des protocoles de lending et de borrowing en crypto
  • Khalil FANCHA, Benoit GOURAUD, Thierry MELCHIOR Victor PIERRON et Louise TIGER, travaux divers sur Energy 4 Climate
  • Justine ENGEL et Vincent RUZAND, analyse des Omiques en médecine prédictive

2022 – 2023

  • Louis LESIAK et Pacôme MANCEAUX et Aurélien AURUS, travaux divers sur Energy 4 Climate
  • Emma KARSENTI, détection de malware polymorphe par analyse dynamique
  • Clément CORNET et Maxence CHOUFA, algorithme de clustering par prétopologie
  • Paco BARRA, Modélisation systémique de l’île de Mayotte

2021 – 2022

  • Benjamin SLIOSBERG, Méthode prédictive des impacts humains des catastrophes naturelles
  • Rémy SIMINEL, Human gene embedding using global vectors algorithm
  • Flavien DESEURE-CHARRON, Analyse comportemental du tourisme photographique

2020 – 2021

  • Jeremy DONADIO, approche machine learning pour la détection d’activité de virus polymorphe.
  • Quentin GABOT, data mining dans un cadre Big Data, application au tourisme
  • Antoine THIOL, méthode hybride de deep learning pour la prédiction de série temporelle
  • Lucas BICHET, algorithme de détection de faille de sécurité dans les navigateurs web

2019 – 2020

  • Loïc STEINLE, analyse statistiques des hotspots touristiques d’Instagram
  • Théo DEMESSANCE, prédiction markovienne des flux touristiques
  • Maelys TESTA et Floriane GIRAULT, quantification et qualification du confort énergétique
  • Thomas REYNOLDS, clustering et analyse des déplacements touristiques dans Paris

2018 – 2019

  • Mathilde LAVELLE, analyse des modèles multi-agents de smart grids
  • Lilia BEN BACCAR, analyse des comportements touristiques par data mining
  • Victor SIROT, analyse des comportements touristiques par processus markovien
  • Victoire BONNET, étude de faisabilité d’une blockchain pour les réseaux de chaleurs

2017 – 2018

  • Loup-Noé LEVY et Bastien PICHON, modélisation numérique de la domotique
  • Rémi TOLLERET, utilité du BIM pour l’efficacité énergétique
  • Hugo POUSSEUR, modèle multi-agent d’un écoquartier sous JADE

2016 – 2017

  • Zeinab NEHAI, la blockchain pour l’autoconsommation
  • Loup-Noé LEVY, modèle multi-agent d’un écoquartier
  • Estelle CATHELINEAU, diffusion de l’énergie dans un réseau

Encadrements de Master/stage

  • 2023-2024

Pablo THOMASSIN: algorithme de clustering mixte par prétapologie

  • 2022-2023

Guillaume GALLET: outils de détection de smishing

  • 2021-2022

Benjamin SLOSBERG: modélisation multi-agent du contentement humain dans un travail intérimaire

  • 2020-2021

Quentin GABOT: profiling des comportements touristiques

Sumayya CHABANE (avec Supergrid-Institute): optimisation par multi-agents d’une centrale hydraulique avec marché de l’énergie

  • 2018-2019

Lilia BEN BACCAR: pattern mining pour la prédiction de comportement touristique

  • 2017-2018:

Hugo POUSSEUR: modèle multi-agent d’un écoquartier

Manon RIVOIRE: modélisation de la domotique par apprentissage

Marc RUAULT: réseaux de jeux appliqué à un éco-quartier

  • 2015-2016:

Zeinab NEHAI: demand-reponse et domotique

Bastien PICHON: demand-side managment et demand-response

Activités d'enseignements

Thématique scientifique : modélisation des systèmes complexes

Introduction

Depuis les années 1950, il est devenu évident aux scientifiques qu’une nouvelle façon de penser et d’analyser un système est essentiel pour comprendre bon nombre des défis complexes auxquels l’humanité est confrontée. Le nouveau paradigme consiste à inférer des règles sur la façon dont le comportement dynamique d’un système complexe dépend des propriétés combinées des éléments individuels, de la nature des interactions entre les éléments, ainsi que de la topologie des interactions entre les éléments, afin de comprendre et de prédire ces systèmes et les contrôler pour avoir des propriétés souhaitables.

Par exemple, il est important de savoir quelles caractéristiques des systèmes complexes génèrent de la résilience contre les perturbations par rapport aux propriétés qui améliorent la sensibilité du système et lui permettent de passer à un état d’équilibre différent pour un large éventail de questions, par exemple sur le changement climatique et effondrement des écosystèmes, l’évolution des espèces et des micro-organismes, les systèmes énergétiques ou même les déplacements/migrations humaines.

Les systèmes complexes sont étudiés sous quatre angles complémentaires : l’émergence, la résilience, les transitions de phase et la prévisibilité/le contrôle. Ces concepts unificateurs abstraits sont reliés à travers diverses disciplines ; des modèles mathématiques faisant appel à de nombreux champs de recherche comme présenté sur la figure 1.1.

système complexe

Avant de parler des deux systèmes complexes étudiés (réseau électrique et flux touristique), cette introduction permettra aux lecteurs de mieux se familiariser avec les différents concepts liés aux systèmes complexes.

Système formel et système empirique

Il n’est pas possible de parler de système complexe sans parler d’entropie de Shannon et de théorie du chaos. Le premier est une fonction mathématique qui, intuitivement, correspond à la quantité d’information contenue ou délivrée par une source d’information. L’entropie d’un système complexe à un comportement particulier. En effet, l’entropie du système dans sa globalité est plus grande que la somme des entropies de chacun de ses sous-systèmes. D’un point de vue mathématique, le système globale possède plus de degrés de liberté (des propriétés émergentes) que l’ensemble de ses sous-systèmes.

Un système relève de la théorie du chaos s’il est extrêmement sensible à des petites causes et si son comportement a un aspect cyclique. Par exemple les systèmes météorologiques sont très sensibles à des petites causes et leur dynamique est cyclique : les saisons. Chaque comportement du système est un point défini dans des espaces de «n» dimensions, appelé espace de phases.

Les trajectoires dans l’espace de phases convergent vers des zones appelées attracteur. Un même système peut avoir un ou plusieurs attracteurs. Les attracteurs sont importants parce qu’ils représentent des zones stables dans le sens où le système tend à rejoindre ces zones ou à migrer vers une autre zone stable. Un bassin d’attraction est un espace de points qui tendent à joindre irrémédiablement vers un attracteur.

Les systèmes qui relèvent de la théorie du chaos sont de deux formes : les systèmes formels et les systèmes empiriques. Les premiers sont définis mathématiquement, souvent sous la forme d’équations différentielles non linéaires, par exemple les équations de Lorenz.

Les systèmes empiriques sont imprévisibles à cause de leur sensibilité aux conditions initiales qu’il est impossible de définir rigoureusement, voire de les dénombrer. Ces systèmes évoluent vers des bassins d’attraction, mais leurs dynamiques au sein de ces bassins sont imprévisibles.

Les systèmes empiriques relèvent de l’observation ne sont pas possibles à modéliser mathématiquement de façon juste. Pour mieux comprendre cette notion, ils sont souvent comparés à un éléphant que des aveugles essayent de reconnaître au toucher (figure 1.2) ; à noter que dans cet exemple le système globale est connu, ce qui est rarement le cas.

système complexe

L’étude des systèmes complexes s’est concrétisée et formalisée par les travaux du Santa Fe Institute depuis 1984. Cet institut a pour mission de rechercher des lois communes à des systèmes complexes de natures variées ; de définir des outils d’analyse et de prévision. Un système complexe est défini comme suit :

Un système complexe est constitué d’agents qui interagissent entre eux, avec leur environnement et avec les phénomènes émergents créés par ces interactions. Les agents peuvent être de nature variée : un animal, une personne, un groupe de personnes, une institution, un organe, une cellule, un enzyme. Les règles de comportement d’un agent définissent les stimuli qu’il émet vers les autres agents en fonction des stimuli qu’il reçoit des autres agents et de son environnement. Ces règles sont évolutives en fonction du vécu de l’agent : stimuli qu’il a reçus et qu’il a émis. L’émergence est un processus de création de phénomènes par les interactions des agents : entre eux et avec leur environnement. Les phénomènes émergents sont de natures variées par exemple l’apparition d’un nouvel agent, d’une modification de l’environnement, d’une loi de distribution des évènements. Les émergences ne sont pas planifiées ni pilotées par une autorité qui aurait une vue d’ensemble du système.

Les systèmes complexes peuvent être de différentes natures. Mes travaux portent sur des systèmes artificiels (artefacts). Ce sont des systèmes construits par l’homme essentiellement au moyen de l’informatique tels que : réseaux de distribution de l’électricité, fouloscopie, robotiques en essaim. Ces systèmes ont la potentialité des fonctionnalités des systèmes complexes adaptatifs.

Caractéristiques des systèmes complexes

Le tableau 1.1 compare l’approche cartésienne d’une approche systémique. Les différentes caractéristiques des systèmes complexes [20] présents dans la figure 1.3 seront détaillées par la suite.

système complexe

systèmes complexes

Les systèmes complexes fonctionnent du bas vers le haut. Ce sont les agents du bas de la hiérarchie qui font fonctionner les systèmes, qui produisent les phénomènes émergents au moyen des interactions entre eux et avec leur environnement.

Le rôle du haut de la hiérarchie est limité à la création des conditions favorables à l’émergence des phénomènes souhaités (bassin d’attraction). Les capacités d’adaptation, d’innovation d’une organisation ainsi décentralisée sont notablement supérieures à celles d’une structure centralisée.

Les systèmes complexes ne sont pas sécables, rappelons que l’entropie nous dit que « le tout est plus que la somme des parties ». Pour étudier un système complexe il faut considérer simultanément tous ses composants : les agents, les interactions et l’environnement. Il faut aussi tenir compte des interactions et de l’évolution temporelle du système

Il faut rassembler des compétences pluridisciplinaires qui couvrent l’ensemble des facettes du système étudié. Cela découle du holisme qui ne permet pas d’étudier isolément les propriétés liées à différentes disciplines. Pour rappel, la figure 1.1 présente diverses théories liées à tous les systèmes complexes.

Les agents possèdent des propriétés, des lois, des règles, des comportements et des actions différentes. Les agents peuvent cependant être regroupé par classe. Bien souvent la spécification des agents est de l’ordre de schémas UML en vues 4+1. La diversité des agents renforce les propriétés des systèmes complexes adaptatifs : émergence, innovation, auto-organisation.

Les évolutions à moyen et long terme des systèmes complexes sont imprévisibles parce qu’il est impossible de définir l’ensemble des variables avec la précision requise pour une prévision. Les exigences de précision croissent exponentiellement avec la portée des prévisions.

Il peut être vain de vouloir identifier la cause d’une situation observée dans un système parce que cette situation est souvent due à des multiples causes. Il est impossible d’identifier une cause principale parmi ces multiples causes qui ont été l’objet d’une succession d’amplifications et d’atténuations dues aux rétroactions.

Par exemple, les causes de l’essor ou de l’affaiblissement d’une civilisation sont souvent incertaines avec des polémiques alimentées par de nombreuses thèses. Il faut distinguer la cause accidentelle qui a déclenché un événement de l’ensemble des causes qui ont créé l’état latent qui a permis ce déclenchement. Cette cause accidentelle est facilement identifiable et est parfois considérée à tort comme la cause principale de cet événement.

Les systèmes complexes sont sujets à des basculements qui sont des évolutions brutales quant à leur ampleur et leur rapidité. Par exemple un engouement collectif, une crise économique, une révolution, ou les conditions initiales. Un point de bascule est un état d’un système où une petite cause peut provoquer un changement profond et brutal de l’état du système.

Comme tout système chaotique, un système complexe possède des cycles d’évolution entre les différents bassins d’attractions. Un basculement peut être conceptualisé comme un saut d’un bassin d’attraction dans un autre. Souvent on ne sait pas identifier les attracteurs des systèmes complexes.

Il y a rétroaction lorsqu’un agent reçoit des stimuli influencés par les stimuli qu’il a émis. Les rétroactions engendrent les propriétés fondamentales des systèmes complexes : holisme, convergence vers des bassins d’attraction, dynamique cyclique, bifurcations, basculements, évolution, adaptation, émergence, auto-organisation, etc. Les rétroactions peuvent avoir un effet stabilisateur, par exemple réguler l’offre par la demande dans un marché, ou au contraire un effet amplificateur, par exemple créer des emballements dont l’archétype est une bulle spéculative. Les capacités d’adaptation des systèmes complexes tiennent aux rétroactions qui font évoluer les règles de comportement de leurs agents en fonction de leur vécu.

Les combinaisons de ces caractéristiques amènent à la caractéristique principale de tous les systèmes complexes : l’émergence. L’émergence est la création (d’une vision holistique) ou l’auto-organisation (d’une vision micro) de nouveaux caractères ou phénomènes dans le système. L’émergence est nécessaire pour l’adaptation, l’évolution, la coévolution, la reproduction.

Cela se produit sous des formes variées :

1. une adaptation / évolution des caractéristiques des agents dans l’espace et le temps ;
2. une adaptation / évolution des comportements, des règles des agents dans l’espace et le temps ;
3. une auto-organisation avec spécialisation des agents ;
4. une auto-organisation avec hiérarchie des agents ;
5. une coévolution entre un couple ou plus d’agents ;
6. une création de nouveaux agents par évolution et spécialisation d’agents existants.

Etude et modélisation systémique

L’étude des systèmes complexes visent différents objectifs :

• Déterminer les agents ;
• Comprendre leur fonctionnement, leurs lois ;
• Comprendre leur évolution ;
• Prévoir leurs évolutions ;
• Définir les interventions pour les faire évoluer dans le sens souhaité.

L’étude systémique dispose d’une vaste panoplie de méthodes et outils :

1. simulation basée sur des agents
2. théorie des graphes et réseaux, intelligence collective, analogie avec d’autres systèmes complexes
3. théorie du bord du chaos, morphogénèse, théorie du chaos, théorie des catastrophes, logique des variables floues, mémétique
4. recherche opérationnelle et algorithmes métaheuristiques (voir figure 1.4).

aide à la décision

Ces outils fonctionnent en itératif. Ils calculent l’état d’un système à l’instant ti+1 en fonction de l’ensemble de son état à l’instant précédent ti. Ils tiennent compte de l’ensemble de l’état du système considéré : états des agents et de l’environnement, stimuli émis par les agents et l’environnement.

La simulation basée sur des agents est une réponse à la trop importante complexité d’une résolution par les mathématiques dans l’étude des systèmes complexes [10]. Il est même souvent impossible de les mettre en équation à cause de la variété des agents et de leurs règles de comportement, de l’évolution des règles de comportement des agents en fonction de leur vécu. A chaque instant tous les agents peuvent avoir des règles de comportement différentes. La modélisation complète des agents cognitifs, personnes ou groupes de personnes, est impossible. Il faut donc simplifier en conservant ce qui est pertinent pour les phénomènes étudiés. La modélisation de systèmes complexes sont des outils d’aide à la décision.

Le processus qui conduit à décider d’une action met en œuvre un ensemble d’opérations convergentes, logiques ou non, sur un groupe d’information plus ou moins important et pertinent, en s’appuyant sur un ensemble de connaissances, dans un environnement déterminé afin d’obtenir un résultat. La pertinence de la procédure suivie pour prendre une décision est rarement évaluée car très complexe, seul le résultat l’est par rapport à un objectif initialement recherché.

Les aides à la décision sont donc des opérations qui facilitent la tâche de prise de décision en simplifiant ou en raccourcissant le chemin cognitif et mathématique suivi par les agents. Les fonctions de ces aides peuvent être très diverses [23] :

• recherches d’informations pertinentes ;
• organisation des informations ;
• traitements partiel ou total d’ensembles disjoints d’informations ;
• activation ordonnée de connaissances ;
• établissement de scénarios ;
• représentations spatiales et / ou temporelles ;
• propositions de décisions.

Les agents, cognitifs ou réactifs, font tous appel à des processus d’aide à la décision afin d’adopter un comportement particulier (voir Figure 1.5) [26]. L’ensemble de ces décisions provoquent, perturbent ou varient l’émergence, la résilience, les phases et le contrôle de l’entièreté du système.

agent cognitif

La modélisation d’un système complexe peut varier en fonction de la décision recherchée. Un modèle générique amène alors à prendre une décision sur tous les aspects de ce système.

REPRENDRE LE CV POUR FAIRE LES RUBRIQUES QUI SUIVENT AVEC REF

Gestion interdisciplinaire dans les systèmes complexes

Contexte

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Gestion de projets interdisciplinaires

achraf

Méthodologies MLOps appliqué aux systèmes complexes

LNL et digital twin

Application au Smart Grid

Contexte

Le développement énergétique a entraîné un changement de paradigme au 21e siècle. Les entités industrielles, politiques et la communauté scientifique recherchent à rendre les villes et le réseau plus intelligents \cite{ramchurn2012putting}. L’Institut français d’études démographiques (INED) déclare que la population mondiale passera à 10 milliards d’habitants en 2050, tandis que la population urbaine doublera (augmentation de 63\%). L’urbanisation étendue nécessite de nouvelles façons de comprendre et de gérer la complexité de la production et de la consommation d’énergie.

De nos jours, bien que les villes n’occupent que 2\% de la surface de la planète, elles abritent environ 50 \% de la population mondiale, consomment 75\% de l’énergie totale générée et sont responsables de 80\% de l’effet de serre \footnote{Programme des Nations Unies pour l’environnement, Visions for Change. Recommandations pour des politiques efficaces sur un mode de vie durable, 2011}. Le développement des villes intelligentes dépend du niveau d’intelligence des réseaux électriques, des producteurs aux consommateurs, des consommateurs aux producteurs. L’aspect le plus important est la coordination entre toutes les entités; un micro-réseau pourra inciter les consommateurs à modifier leur consommation dans des conditions critiques pour ne pas altérer l’infrastructure électrique.

Partout dans le monde, des réseaux intelligents sont développés pour réduire les déchets électriques et prévenir les pannes d’électricité. Simuler un micro-réseau, un éco-quartier ou une centrale électrique virtuelle, est difficile, compte tenu de leurs différents comportements et structures. Chacun varie selon plusieurs aspects: social, économique, énergétique, mobilité et bien-être de ses habitants.

Les réseaux intelligents et les villes intelligentes doivent être compris. Ils sont généralement décrits comme un système complexe et la meilleure façon de l’analyser est de modéliser et de simuler. Dans ce contexte, l’objectif est de créer un modèle hors contexte afin de donner des outils d’aide à la décision pour des questions sociales, économiques et algorithmiques sur un micro-réseau plus intelligent.

Modélisation systémique

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Outils d'aide à la décision

Le réseau a besoin en permanence d’estimer sa consommation / sa production dans un futur proche et lointain. Anciennement basé sur les données des jours et années précédentes, le réseau intelligent doit se doter de systèmes de prédiction analysant les données en temps réels.

Pour cela, de nombreux outils d’apprentissage machine, et plus particulièrement d’apprentissage profond sont basés sur des données de centaines de capteurs afin de réaliser une prédiction fiable. Cependant, ce dispositif est complexe dans sa mise en place, son exploitation et sa maintenance.

L’objectif des travaux réalisés sur ce sujet vise à fournir un outil de prédiction de la consommation fiable sans avoir recours à un mise en condition d’un bâtiment. Les données utilisées peuvent être fourni par un simple boîtier intelligent de type Linky.

La consommation de chaque appareil est transformé en séquences de consommation. Ces dernières fournissent alors les données suffisantes à la prédiction. Les modèles utilisés jusqu’ici proviennent du minage de données et sont basés sur de l’apprentissage par des arbres de préfixes. Les modèles sont de types Markoviens (avec ou sans inférence grammaticale) ou des arbres compacts.

Applications diverses

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Application au Tourisme

Contexte

En raison de la rapidité des échanges d’informations sur Internet par les utilisateurs, de nombreuses destinations ont connu une augmentation du nombre de touristes. Les entreprises ont reconnu très tôt l’énorme potentiel d’Instagram en tant que plate-forme publicitaire, de nombreuses entreprises avisées collaborent avec les meilleurs influenceurs du site pour servir d’ambassadeurs \cite{fatanti2015beyond}. L’Office du tourisme du lac Wanaka en Nouvelle-Zélande en est un bon exemple : en 2015, ils ont invité les influenceurs d’Instagram à partager leurs photos de la région. En conséquence, les visites touristiques ont bondi de 14\%, ce qui représente le taux de croissance le plus rapide de la Nouvelle-Zélande.

L’analyse des sites touristiques est assez facile, mais l’analyse des flux touristiques entre les points chauds d’une même ville est un défi \cite{li2018big}. La capacité de nos technologies et algorithmes de traitement actuels est bloquée par trois aspects : le volume de données, la vitesse de génération des données, la variété des types de données, également connus sous le nom de 3V.

Les touristes veulent une recommandation en fonction de leurs intérêts car le temps est un élément clé de la planification du voyage et il s’agit d’une tâche qui prend beaucoup de temps lorsqu’elle est réalisée par le touriste.

Segmentation des touristes

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Analyse des déplacements

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Intérêts touristiques communs

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Application en Cybersécurité

Contexte

La surcharge en outils numériques du réseau rend tout son système non résilient à la menace des virus informatiques. Le nombre d’attaques par des virus polymorphes ou BOTNET croient à mesure que le système migre de systèmes physiques vers des systèmes numériques.

La détection des virus polymorphes est complexe voir impossible sans une connaissance du réseau et de son comportement. La détection d’activité suspecte est alors possible en comparant la réalité avec les différentes prédictions du système.

fr_FRFR