Michel Bret, professeur émérite des universités
Colloque « Corps en mutation », Université de Toulouse-le Mirail, mars 2006
Mots clés : interactivité, mimétisme, réseaux neuronaux, vie artificielle
Résumé
Les récentes avancées des neurosciences, de la robotique et des systèmes temps réel ont montrés la nouvelle importance prise par le concept d’interactivité avec le couple perception-action à l’œuvre aussi bien chez les organismes vivants que dans les systèmes artificiels construits sur des modèles biologiques. Le connexionnisme (avec les réseaux neuronaux) et l’évolutionnisme (avec les algorithmes génétiques et la programmation génétique) reposent le rapport du créateur avec son œuvre. Celle-ci, douée d’une perception et d’une action artificielles, fait preuve d’une véritable autonomie.
A travers des expérimentations sur le mimétisme, je tenterai de montrer que des organismes artificiels sont capables de s’adapter spontanément à un environnement naturel imprévu comme peut l’être la disposition de la salle de conférence.
Plus précisément un acteur de synthèse sera construit inter activement sous la forme d’un corps anthropomorphe situé dans un environnement simulé obéissant aux lois de la physique. Il ne s’agit ni d’un clone ni d’un robot, mais d’un organisme hybride, entre le vivant et l’artificiel, muni d’organes de perception, d’organes moteurs et d’un système nerveux central. Le but de l’expérimentation sera de montrer que, grâce à la plasticité des réseaux neuronaux, l’acteur peut se modifier et s’auto organiser, de façon autonome, afin de remplir une fonction de mimétisme.
Le système perceptif sera construit en connectant une webcam (considérée comme un « œil ») à une rétine artificielle (l’image mémoire de la caméra). Cette rétine sera ensuite connectée à la couche d’entrée d’un réseau neuronal, l’activation qui en résulte se propage (sous forme d’influx nerveux) alors à travers les synapses des neurones constituant les différentes couches cachées (sorte de « cortex ») pour finalement atteindre la couche de sortie constituée de neurones moteurs. Ceux-ci sont alors connectés au système musculaire de l’acteur artificiel qui se met à bouger en fonction des informations lumineuses qu’il reçoit sur sa rétine.
Ayant constaté que ces mouvements sont désordonnés, la deuxième partie de l’expérience consistera à « apprendre » au réseau à imiter des gestes qu’on lui montre. Pour cela on mémorise des « couples d’apprentissage » sous la forme d’une position montrée (devant la caméra) et d’une position interprétée (par l’acteur artificiel), puis on lance un apprentissage (en utilisant l’algorithme de la rétropropagation de l’erreur) qui aura pour but de modifier les valeurs des synapses afin que les positions interprétées correspondent le mieux possible aux positions montrées. A l’issu de cet apprentissage, non seulement l’acteur est capable d’exécuter correctement les positions montrées, mais il est en outre capable de donner des interprétations cohérentes de gestes qu’on ne lui a pas appris (propriété de généralisation des réseaux neuronaux).
Une deuxième expérimentation sera tentée qui consiste à saisir, non plus des positions arrêtées, mais des séquences de mouvements continus.
Les applications d’un tel système à la chorégraphie, au théâtre, au cirque ainsi qu’a tous les arts vivants seront soulignées.
Enfin des systèmes préalablement entraînés à interpréter de la musique seront montrés sous forme d’installations interactives crées par l’auteur.
1 Les deux interactivités
Avec Edmond Couchot et Marie-Hélène Tramus nous distinguons plusieurs types d’interactivité [1] :
La « première interactivité », ou interactivité de commande, qui est celle de la simple boucle rétroactive de la cybernétique et qui est à la base de la plupart des systèmes interactifs.
Puis la « seconde interactivité » (par analogie avec la seconde cybernétique) qui apparaît dès lors que le système qui la produit est capable de se modifier lui-même au cours d’un apprentissage par lequel il interagit avec son environnement afin de s’y adapter. Il s’agit bien là d’un comportement que l’on pourrait qualifier d’ « intelligent » et qui traduit le concept d’autopoiése introduit par Francisco Varela[2].
2 Neurones et création
En 1995, à la suite de Karl Sims [3], de Van de Panne et Fiume [4], et sensibilisé par l’artiste américain Michael Tolson à la technique des réseaux neuronaux, je m’intéressais au connexionnisme et à ses applications artistiques, en particulier dans le domaine de l’interactivité [5].
La vie a résolu le problème de l’adaptation des organismes à leur environnement en inventant les systèmes nerveux centraux, constitués de neurones massivement interconnectés au moyen de liaisons modifiables par l’expérience [6].
L’informatique permet de simuler de tels systèmes au moyen des « réseaux neuronaux » [7]. Prenons l’exemple des réseaux multi couches à apprentissage supervisé. Il s’agit de construire des êtres virtuels munis :
1) D’un système perceptif (dont les organes sont des capteurs qui se projettent sur les neurones de la couche d’entrée du réseau neuronal).
2) D’un système moteur (muscles d’un modèle dynamique de l’être de synthèse commandés par les neurones moteurs, qui sont ceux de la couche de sortie du réseau).
3) De plusieurs couches cachées figurant le « cortex » du cerveau artificiel.
4) Enfin d’un protocole d’apprentissage permettant d’entraîner le réseau lors d’expérimentations au cours des quelles les poids des connexions sont modifiés (par l’algorithme dit de la « rétropropagation de l’erreur ») afin de satisfaire de mieux en mieux aux directives du « professeur » chargé d’éduquer le réseau.
3 Construction d’un organisme artificiel vivant
3-1 Commande d’un personnage virtuel
Une simple Web Cam nous servira d’organe visuel (œil artificiel) que nous allons connecter au personnage virtuel que voici : Il est constitué d’un squelette articulé (figure 3-1) sur lequel ont été attachés des muscles dynamiques (figure 3-2), sur l’ensemble de ces deux structures a été tendue une peau (figure 3-3). Lorsque l’on communique une excitation aux muscles (en utilisant divers capteurs : Souris, gyroscopes, caméra, data suit, etc..), le squelette bouge et la peau se modifie automatiquement (figure 3-4).
Ce dispositif constitue une installation interactive de premier niveau (interactivité de commande) dans laquelle la simulation ne fait qu’obéir aux ordres de l’expérimentateur.
Figure 3-1 Squelette Figure 3-2 Muscles
Figure 3-3 Peau Figure 3-4 Activation des muscles
3-2 Schéma perception-action
Si nous connectons l’œil-caméra à la rétine du personnage virtuel celui-ci ne voit pas pour autant, il lui manque en effet des éléments indispensables à la perception : Un nerf optique, un cerveau et des sorties lui permettant d’agir. Dotons-le d’un cerveau artificiel, celui-ci est un réseau neuronal ainsi construit(figure 3-5) :
Une couche d’entrée constituée d’autant de neurones que la rétine contient de pixels, chacun de ceux-ci envoie au neurone qui lui est connecté un signal proportionnel à l’intensité lumineuse arrivant en ce point de la rétine.
D’une ou plusieurs couches cachées.
D’une couche de sortie dont chaque neurone est connecté à un muscle du personnage.
Les neurones sont connectés deux par deux par des synapses dont les poids (qui servent à moduler les transitant entre les neurones) sont stockés dans une matrice.
Sur les figures 3-6, 3-7 et 3-8 on voit l’image d’un objet clair se déplaçant sur la rétine (en bas et à gauche de l’écran) et se projetant sur les neurones de la couche d’entrée (à gauche du réseau) dont l’activation, passée aux neurones moteurs de sortie (via la couche cachée) agissent sur les muscles du personnage virtuel et le font bouger.
Ce dispositif constitue une installation interactive de deuxième niveau (bâtie sur le schéma perception-action) dans laquelle la simulation est le résultat d’une perception artificielle.
La matrice est initialisée aléatoirement, les mouvements sont donc arbitraires et, bien que produits par l’image, ils ne semblent pas avoir de relation avec elle
Figure 3-5 Réseau neuronal
3-3 Apprentissage supervisé
Lorsque une image est présentée en entrée, le corps prend une position qui dépend de la matrice des poids et, lorsque cette image change, c’est à dire lorsque l’œil regarde, le corps bouge.. Nous nous proposons d’affecter à cet acteur virtuel la capacité d’imiter. Pour cela nous construisons des couples d’apprentissage sous la forme d’une image (la photo d’un expérimentateur réel prenant une certaine position) et d’une configuration du corps virtuel reproduisant cette position. Puis nous entraînons ce réseau par l’algorithme de la rétropropagation de l’erreur de façon à ce qu’il reconnaisse les positions montrées. A l’issu de cet entraînement, grâce à la propriété de généralisation des réseaux neuronaux, ce réseau est capable de reconnaître, non seulement les positions apprises, mais encore toutes les positions proches de celles-ci et, même, des positions non apprises.
La figure 3-9 montre la saisie de couples d’apprentissages. Trois positions debout et trois positions accroupies ont déjà été saisies (elles apparaissent sous la forme de petites photos en haut de l’écran). Une position écartée est en cours de saisie, l’image caméra apparaît en bas et à gauche de l’écran, le personnage est mis dans la même position écartée. Le réseau en activité apparaît au milieu, avec sa couche d’entrée connectée à la rétine (les pixels de l’image caméra), sa couche cachée et sa couche de sortie connectée aux muscles du personnage virtuel. Les segments blancs entre les couches figurent l’influx nerveux circulant entre les neurones.
La figure 3-10 montre l’apprentissage en train de se faire. La courbe d’erreur reproduit les pérégrinations de l’algorithme d’apprentissage, montrant de nombreuses hésitations et même de fausses pistes, rapidement abandonnées. Initialement de 75% , l’erreur tombe en dessous des 50% après une vingtaine d’essais, elle n’est plus que de 26% après 38 essais.
Sur la figure 3-11 on voit que la courbe d’erreur descend globalement et, après 210 essais l’erreur est tombée en dessous de 2%, ce qui est un excellent apprentissage.
La figure 3-12 montre le réseau en action en train de reconnaître une position prise par un acteur réel devant la caméra. On voit que l’image de celui-ci, en bas et à gauche, ne reproduit qu’imparfaitement la position écartée (sur la figure 4-4, les bras sont plus hauts), cependant le réseau a reconnu cette position.
Notons que « imiter » ne signifie pas nécessairement « faire la même chose ». Par exemple nous pouvons donner des couples d’apprentissages arbitraires pour apprendre au personnage virtuel à se lever quand on se baisse ou à se plier quand on s’étend.
Une utilisation intéressante de ce système consisterait à le confier à un chorégraphe qui entraînerait le personnage virtuel à danser dans un certain style.
Une autre application consiste à munir le personnage virtuel simultanément de plusieurs sens, par exemple l’ouie et la vue, en connectant une caméra vidéo et un signal audio aux entrées de un ou plusieurs réseaux neuronaux. J’ai réalisé une telle installation interactive proposant aux spectateurs de danser sur une musique avec un personnage virtuel qui « entendait » également cette musique. Il en résulte une mise en résonance des deux danseurs (réel et virtuel) avec la musique.
Figure 3-10 : Début
d’apprentissage (erreur de 26% après 38 essais)
Figure
3-11 : Amélioration de l’erreur qui est tombée à moins de 2% (après 210 essais)
Figure 3-12 :
Réseau en action : Le personnage prend une position proche de la position
apprise (écartée), bien que la position montrée ne soit pas exactement celle
proposée en apprentissage (voir figure 3-9).
4 Conclusion
Je crois avoir montré expérimentalement
que l’interactivité, loin de se réduire à un simple schéma stimulus-réponse,
s’apparente au schéma perception-action à la base des comportements les plus
évolués des êtres vivants qui fait intervenir un système nerveux dont la
plasticité lui permet de se transformer et de s’adapter à un environnement par
apprentissage. Ainsi se trouve
dépassée, je pense, l’opposition traditionnelle entre une soit disant
rationalité scientifique ou technique et une prétendue intuition
artistique : Finalement, tout ceci n’est qu’une affaire de neurones…
[1] M.-H. Tramus, M. Bret, E. Couchot , La seconde interactivité, in Arte e vida no século XXI, Organizadora Diana Domongues, UNESP, Brasil (2003).
[2] F.J. Varela Connaitre - Les sciences cognitives, tendances et
perspectives, Ed.
du Seuil, 1989
[3] Karl Sims, Evolving Virtual Creatures, in Computer Graphics,
15-22, 1994.
[4] Michiel Van de Panne, Eugène Fiume,
Sensor-Actuator Networks, in Computer Graphics, 335-342, 1993.
[5] M. Bret, Virtual Living Beings, in Lecture Notes in Artificial Intelligence, Virtula Worlds 119-134, Ed. Jean-Claude Heudin, Springer 2000.
[6] Jean Pierre Changeux, L’homme
neuronal, Fayard, 1983
[7] Hervé Abdi: Les réseaux
de neurones, Presses Universitaires de Grenoble 1994.