Interactivité intelligente

 

 

Michel Bret

Professeur émérite des université, Art et Technologies de l’Image, Université Paris 8, 2005

 

L’Art à l’époque de sa numérisation, organisé par L’Unité de Recherche «Esthétique, Art, Synergie environnemental et Recherche » en collaboration avec l’ISAM de l’Université de Gabès et l’Association des Arts et Cultures de l’Oasis, 11-12 Novembre 2005 A l’ISAM de Gabès, Tunisie

 

Mots-clés :

Art, création, interactivité, pédagogie, réseaux neuronaux.

 

Résumé :

 La « première interactivité » traduit la boucle rétroactive de la cybernétique, la « seconde interactivité » (par analogie avec la seconde cybernétique) concerne les systèmes capables de s’auto configurer et rejoint par là les stratégies du vivant. Les réseaux de neurones permettent de simuler de tels organismes artificiels en complétant la pensée algorithmique par des processus d’apprentissages interactifs. Les problématiques de la création numérique et de son enseignement, celles des dispositifs artistiques ou ludo-éducatifs, ainsi que celles de l’écriture des logiciels qui les rendent possible se trouvent ainsi reposés à la lumière d’une interactivité que nous qualifierons d’ « intelligente ».

 

Introduction

 

         J’ai découvert l’art numérique à ses début, dans les années 70, à une époque où n’existaient ni logiciels, ni même de systèmes informatiques, j’ai donc du construire une interface entre la machine et l’artiste qui ne soit ni contraignante ni difficile d’accès. Je conçus le système anyflo qui est caractérisé par sa généralité (pas d’hypothèses particulières quant aux objets traités), son adaptabilité (possibilité de l’enrichir indéfiniment) et sa facilité d’emploi (destiné aux artistes). Il m’a permis de réaliser de nombreux films de synthèse, de construire des installations interactives à finalité artistique, ludique ou à but pédagogiques , je l’utilise aussi dans la simulation de toutes sortes de phénomènes. C’est ainsi que, avec le professeur Alain Berthoz du Collège de France et Marie-Hélène Tramus (professeur en ATI à l’Université Paris 8), nous avons étudié les lois naturelles du mouvement  (plan de phase, contre phases, loi de la puissance deux tiers, référentiels d’interaction, …) [1].

Je le considère comme ma palette de peintre, en perpétuelle reconfiguration. C’est aussi une sorte d’organisme artificiel interactivement adaptable. Par exemple l’introduction des réseaux neuronaux et des algorithmes génétiques a profondément modifier ma façon de programmer et donc la structuration même du système.

Le langage intègre de puissants outils de débuguage qui peuvent aussi bien être utilisés dans un but pédagogique pour expliquer la synthèse d’images, l’animation par ordinateur, la dynamique, la programmation graphique ou même des courants de pensée comme le connexionnisme ou l’évolutionnisme. J’ai utilisé ces possibilités dans les cours que j’ai dispensé en Art et Technologies de l’Image à l’Université de Paris 8, je les utilise aujourd’hui pour créer des œuvres interactives et les expliquer au public.

 

1 Les deux interactivités

 

Avec Edmond Couchot et Marie-Hélène Tramus nous distinguons plusieurs types d’interactivité [2] :

La « première interactivité », ou interactivité de commande, qui est celle de la simple boucle rétroactive de la cybernétique et qui est à la base de la plupart des systèmes interactifs.

Puis la « seconde interactivité » (par analogie avec la seconde cybernétique) qui apparaît dès lors que le système qui la produit est capable de se modifier lui-même au cours d’un apprentissage par lequel il interagit avec son environnement afin de s’y adapter. Il s’agit bien là d’un comportement que l’on pourrait qualifier d’ « intelligent » et qui traduit le concept d’autopoiése introduit par Francisco Varela[3].

 

2 Neurones et création

 

En 1995, à la suite de Karl Sims [4], de Van de Panne et Fiume [5], et sensibilisé par l’artiste américain Michael Tolson à la technique des réseaux neuronaux, je m’intéressais au connexionnisme et à ses applications artistiques, en particulier dans le domaine de l’interactivité [6].

La vie a résolu le problème de l’adaptation des organismes à leur environnement en inventant les systèmes nerveux centraux, constitués de neurones massivement interconnectés au moyen de liaisons modifiables par l’expérience [7].

L’informatique permet de simuler de tels systèmes au moyen des « réseaux neuronaux » [8]. Prenons l’exemple des réseaux multi couches à apprentissage supervisé. Il s’agit de construire des êtres virtuels munis :

1) D’un système perceptif (dont les organes sont des capteurs qui se projettent sur les neurones de la couche d’entrée du réseau neuronal).

2) D’un système moteur (muscles d’un modèle dynamique de l’être de synthèse commandés par les neurones moteurs, qui sont ceux de la couche de sortie du réseau).

3) De plusieurs couches cachées figurant le « cortex » du cerveau artificiel.

4) Enfin d’un protocole d’apprentissage permettant d’entraîner le réseau lors d’expérimentations au cours des quelles les poids des connexions sont modifiés (par l’algorithme dit de la « rétropropagation de l’erreur ») afin de satisfaire de mieux en mieux aux directives du « professeur » chargé d’éduquer le réseau.

 

 

 

 

3 « La funambule virtuelle » et « danse avec moi »

 

Avec Marie-Hélène Tramus, je développais « La funambule virtuelle » puis « danse avec moi », installations interactives mettant en scène des acrobates et des danseurs de synthèse munis de réseaux neuronaux les dotant de comportements « intelligents ».

Sur l’image 3-1 on peut voir un schéma de l’installation :

1) Une danseuse réelle (à gauche) est munie de capteurs qui sont connectés à la couche d’entrée du réseau (à droite).

2) Une danseuse virtuelle (au milieu) est aussi munie de capteurs (virtuels ceux-ci) également connectés à la couche d’entrée.

3) L’ensemble de ces connexions constitue une sorte de « système perceptif » du personnage virtuel, le réseau lui-même jouant le rôle d’un petit « cerveau ».

4) La couche de sortie est connectée aux muscles du modèle dynamique du corps virtuel.

5) Le bouclage cybernétique réside dans la modification des perceptions de la danseuse virtuelle de par ses actions mêmes.

6) L’interactivité résulte dans le comportement de la danseuse réelle confrontée à cette boucle et agissant sur elle.

7) Enfin le système répond au principe de la « deuxième interactivité » puisque les réseaux s’auto configurent par apprentissage  au cours d’expérimentations.

 

 

 

 

Figure 3-1:Schéma de l’installation.

 

 

Figure 3-2 : Une funambule professionnelle interagissant avec la funambule virtuelle

 

 

 

 

 

Figure 3-3 La funambule au théâtre

 

 

Figure 3-4 La funambule en exposition

 

 

 

 

 

Figure 3-5 : Danse avec moi

 

4 Exemple de questionnement : Celui de l’imitation

 

Un réseau neuronal est en lui-même un système abstrait insensible à la sémantique de ses entrées, celles-ci peuvent donc être connectées à n’importe quel type de capteurs :

Dans l’expérience de la Funambule Virtuelle ces capteurs modélisaient une sorte de kinesthésie, sens par lequel le personnage virtuel prenait connaissance de la disposition de son propre corps (mesurée par les angles relatifs de ses membres), ces informations, passées en entrée du réseau, donnaient lieu, en sortie, à la description du mouvement qui rétablissait l’équilibre.

 

Dans une autre série d’expérimentations j’ai construit un personnage artificiel muni d’un œil (une caméra vidéo), d’une rétine (l’image numérique produite par cette caméra) et d’un nerf optique (les connexions de chaque pixel de cette image à autant de neurones sur la couche d’entrée). Le réseau transmet l’activation des ses entrées aux couches cachées successives et jusqu’à ses sorties qui sont des neurones moteurs agissant sur le système musculaire animant le personnage virtuel. Lorsque une image est présentée en entrée, le corps prend une position qui dépend de la matrice des poids et, lorsque cette image change, c’est à dire lorsque l’œil regarde, le corps bouge. La matrice est initialisée aléatoirement, les mouvements sont donc arbitraires et, bien que produits par l’image, ils ne semblent pas avoir de relation avec elle. Nous nous proposons d’affecter à cet acteur virtuel la capacité d’imiter. Pour cela nous construisons des couples d’apprentissage sous la forme d’une image (la photo d’un expérimentateur réel prenant une certaine position) et d’une configuration du corps virtuel reproduisant cette position. Puis nous entraînons ce réseau par l’algorithme de la rétropropagation de l’erreur de façon à ce qu’il reconnaisse les positions montrées. A l’issu de cet entraînement, grâce à la propriété de généralisation des réseaux neuronaux, ce réseau est capable de reconnaître, non seulement les positions apprises, mais encore toutes les positions proches de celles-ci et, même, des positions non apprises.

            Pour réaliser ces expérimentations j’ai écrit un programme interactif interfaçant le modèle neuronal avec une webcam.

            Sur les figures 4-1, 4-2 et 4-3 on voit l’image d’un objet clair se déplaçant sur la rétine (en bas et à gauche de l’écran) et se projetant sur les neurones de la couche d’entrée (à gauche du réseau) dont l’activation, passée aux neurones moteurs de sortie (via la couche cachée)  agissent sur les muscles du personnage virtuel et le font bouger.

            La figure 4-4 montre la saisie de couples d’apprentissages. Trois positions debout et trois positions accroupies ont déjà été saisies (elles apparaissent sous la forme de petites photos en haut de l’écran). Une position écartée est en cours de saisie, l’image caméra apparaît en bas et à gauche de l’écran, le personnage est mis dans la même position écartée. Le réseau en activité apparaît au milieu, avec sa couche d’entrée connectée à la rétine (les pixels de l’image caméra), sa couche cachée et sa couche de sortie connectée aux muscles du personnage virtuel. Les segments blancs entre les couches figurent l’influx nerveux circulant entre les neurones.

            La figure 4-5 montre l’apprentissage en train de se faire. La courbe d’erreur reproduit les pérégrinations de l’algorithme d’apprentissage, montrant de nombreuses hésitations et même de fausses pistes, rapidement abandonnées. Initialement de 75% , l’erreur tombe en dessous des 50% après une vingtaine d’essais, elle n’est plus que de 26% après 38 essais.

            Sur la figure 4-6 on voit que la courbe d’erreur descend globalement et, après 210 essais l’erreur est tombée en dessous de 2%, ce qui est un excellent apprentissage.

            La figure 4-7 montre le réseau en action en train de reconnaître une position prise par un acteur réel devant la caméra. On voit que l’image de celui-ci, en bas et à gauche, ne reproduit qu’imparfaitement la position écartée (sur la figure 4-4, les bras sont plus hauts), cependant le réseau a reconnu cette position.

            Notons que « imiter » ne signifie pas nécessairement « faire la même chose ». Par exemple nous pouvons donner des couples d’apprentissages arbitraires pour apprendre au personnage virtuel à se lever quand on se baisse ou à se plier quand on s’étend.

            Une utilisation intéressante de ce système consisterait à le confier à un chorégraphe qui entraînerait le personnage virtuel à danser dans un certain style.

            Une autre application consiste à munir le personnage virtuel simultanément de plusieurs sens, par exemple l’ouie et la vue, en connectant une caméra vidéo et un signal audio aux entrées de un ou plusieurs réseaux neuronaux. J’ai réalisé une telle installation interactive proposant aux spectateurs de danser sur une musique avec un personnage virtuel qui « entendait » également cette musique. Il en résulte une mise en résonance des deux danseurs (réel et virtuel) avec la musique.

 

Figure 4-1 : Un objet clair, en bas de l’image rétinienne, produit une activation des neurones d’entrée

 

 

 

Figure 4-2 : L’objet s’est déplacé, l’activation aussi, le personnage change de position

 

Figure 4-3 : L’objet s’est encore déplacé, l’activation aussi, le personnage change de position

 

 

 

 

Figure 4-4 : 3 positions debout et 3 positions accroupies ont déjà été saisies, l’acquisition d’une position écartée est en cours

 

 

Figure 4-5 : Début d’apprentissage (erreur de 26% après 38 essais)

 

 

 

 

 

Figure 4-6 : Amélioration de l’erreur qui est tombée à moins de 2% (après 210 essais)

 

 

 

Figure 4-7 : Réseau en action : Le personnage prend une position proche de la position apprise (écartée), bien que la position montrée ne soit pas exactement celle proposée en apprentissage (voir figure 4-4).

 

4 Conclusion

 

         Je crois avoir montré, à travers la création du logiciel « anyflo », de ses interfaces pédagogiques et artistiques et des dispositifs ludo-éducatifs que peuvent être les installations interactives, que les problématiques de la création numérique sont inséparables de celles de l’interactivité. Loin de se réduire à un simple schéma stimulus-réponse elle s’apparente au schéma perception-action à la base des comportements les plus évolués des êtres vivants et faisant intervenir un système nerveux dont la plasticité lui permet de se transformer et de s’adapter à son environnement par apprentissage. Ainsi se trouve  dépassée, je pense, l’opposition traditionnelle entre une soit disant rationalité scientifique ou technique et une prétendue intuition artistique : Finalement, tout ceci n’est qu’une affaire de neurones…

 



[1] M. Bret, M.H. Tramus, A. Berthoz, Interacting with an intelligent dancing figure : artistic experiments at the crossroads between art and cognitive science, Leonardo, Vol 38, No 1, pp. 46-53, 2005.

[2] M.-H. Tramus, M. Bret, E. Couchot , La seconde interactivité, in Arte e vida no século XXI, Organizadora Diana Domongues, UNESP, Brasil (2003).

[3] F.J. Varela Connaitre - Les sciences cognitives, tendances et perspectives, Ed. du Seuil, 1989

[4] Karl Sims, Evolving Virtual Creatures, in Computer Graphics, 15-22, 1994.

[5] Michiel Van de Panne, Eugène Fiume, Sensor-Actuator Networks, in Computer Graphics, 335-342, 1993.

[6] M. Bret, Virtual Living Beings, in Lecture Notes in Artificial Intelligence, Virtula Worlds 119-134, Ed. Jean-Claude Heudin, Springer 2000.

[7] Jean Pierre Changeux, L’homme neuronal, Fayard, 1983

[8] Hervé Abdi: Les réseaux de neurones, Presses Universitaires de Grenoble 1994.