L’autonomie dans le champ des arts numériques

Michel Bret, professeur émérite, ATI, Universitée Paris8

 

6th International Art Meeting, Katowice Poland mai 2007

 

Mots clés

Art, autonomie, cohérence de flux, interactivité, réseaux neuronaux.

 

1 Résumé

 

L’homéostasie (avec le feed-back de la première cybernétique) permet à un automate de maintenir constants ses paramètres fondamentaux, mais, pour survivre dans un environnement variable et imprévisible, il doit pouvoir s’auto organiser (deuxième cybernétique). Le système nerveux central des êtres évolués constitue un excellent modèle pour construire des organismes artificiels doués d’autonomie.

Si on considère une œuvre comme entité artificielle,  à quelles conditions peut-elle être autonome ? Il faut d’abord qu’elle soit interactive (propriété essentielle de tous les êtres vivants), ensuite elle devra être évolutive (adaptation à un environnement non stable), et enfin elle devra se libérer de l’emprise de son créateur qui lui aura donc fourni un principe d’indépendance ou de désobéissance. Cet article propose une méthode originale basée sur la cohérence des flux pour résoudre la question de l’autonomie des œuvres.

 

2 Introduction

 

La première cybernétique pose la boucle rétroactive comme fondement de l’homéostasie [1], la seconde cybernétique [2] s’intéresse à l’auto organisation et à l’émergence dans les systèmes complexes.

Une œuvre, considérée comme entité artificielle,  peut être construite et analysée à la lumière de la théorie des systèmes, et singulièrement celle des systèmes complexes.

Si l’on ne perçoit bien que ce que l’on connaît, comment peut-on alors construire de nouvelles connaissances et comment peut-on créer, comment le nouveau émerge-t-il de l’ancien ? L’hypothèse d’une conscience extérieure au système et qui en dirigerait le devenir ne fait que déplacer le problème au niveau de cette conscience elle-même. Nous pensons que seule l’auto organisation permet de rendre compte de cette émergence et que, appliquée à la création artistique, elle pose le statut d’autonomie de l’œuvre au cœur du processus même de création.

 

3 Autonomie et créativité

 

Avec le concept de « seconde interactivité », nous avons introduit, Marie-Hélène Tramus, Edmond Couchot et moi-même [3], la notion d’autonomie dans les œuvres interactives. L’interactivité n’est plus une simple commande (fut-elle doublée d’une homéostasie par feed-back), mais devient dialogue avec un être artificiel doué de comportements caractérisant le vivant, il est en particulier libre dans le sens que ses actions n’ont pas été prédéfinies (ni même programmées) mais qu’elles émergent lors d’apprentissages au cours des quels il se construit une sorte de mémoire anecdotique.

La théorie de l’autopoièse, développée par Francisco Varela [4], permet d’expliquer l’évolution d’un organisme dans son environnement en dehors de toute référence à une quelconque " représentation ». C’est son organisation autopoïétique qui est invariant chez tout organisme vivant, le propre d’un système autopoïétique consistant précisément à maintenir invariant sa propre organisation en tant que processus dynamique.

Appliqué à la création artistique de tels concepts conduisent à penser l’œuvre comme autonome, non seulement dans son fonctionnement, mais encore dans sa conception même. La nouvelle liberté qu’elle acquiert, du fait des modèles biologiques utilisés, son autonomie, repose en termes nouveaux les rapports du créateur à son œuvre : le seul contrôle démiurgique cède la place à un dialogue complexe et évolutif entre les artistes, les technologies, les machines, la société et des réalisations quasi vivantes.

Un des aspects les plus frappants des systèmes nerveux des animaux qui en sont pourvus est leur très grande plasticité : les actions d’un organisme sur son environnement provoquent la perception de celui-ci par celui-là, et ce couple perception-action passe par un réseau complexe de neurones massivement interconnectés. La réorganisation spontanée de ce système au cours d’apprentissages fait émerger des comportements adaptés. Nous avons utilisé certains modèles fournis par le connexionnisme, comme les réseaux neuronaux, pour doter nos créatures artificielles d’une certaine autonomie.

 

4 Des expérimentations

 

4-1 Un modèle de corps vivant construit sur une boucle perception-action

 

J’ai défini dans les années 95 un modèle de corps artificiels vivants ainsi structuré [5] [6] (voir figure 1) :

Un squelette articulé rigide.

Un système musculaire dont chaque élément lie deux os du squelette et dont les déformations provoquent les mouvements de celui-ci.

Différents organes.

Une peau souple recouvrant les éléments précédents.

Ce corps obéit à des lois biomécaniques et est muni de capteurs :

Certains, virtuels, lui permettent d’interagir avec un environnement simulé dans lequel il est placé.

D’autres assurent l’interaction avec le monde réel, le créateur et les spectateurs.

Un petit cerveau sous la forme d’un réseau de quelques centaines de neurones dont la couche d’entrée est connectée aux capteurs (par exemple aux cellules d’une rétine artificielle, image de la webcam, ou à la configuration du corps, jouant un rôle proprioceptif) et dont la couche de sortie est connectée au système musculaire (neurones moteurs) (voir figure 2).

Des protocoles d’apprentissages permettent d’auto configurer la matrice des poids synaptiques du réseau neuronal.

 

    

 

Figure 1 : 3 niveaux de modélisation                                  Figure 2 : réseau neuronal

 

4-2 Autonomie faible

 

4-2-1 Réseau neuronal multi couches

 

Des réseaux neuronaux multi couches entraînées par l’algorithme de la « rétropropagation de l’erreur » présentent des capacités d’improvisation.

Plus précisément, de tels réseaux sont structurés en couches de neurones, chacun des neurones d’une couche étant connecté à tous les neurones de la couche suivante. Si IN est la somme pondérée par les poids synaptiques des entrées d’un neurone :

sa sortie OUT peut être calculée par une fonction sigmoïde de la forme :

 

 

où k est une constante qui, si elle est petite, permet d’assouplir le seuillage :

 

 

Les poids synaptiques sont stockés dans une matrice ne*ne (où ne est le nombre total des neurones). Les capteurs (organes des sens de l’être artificiel) se projettent sur la couche d’entrée. Des couches cachées éventuelles figurent un « cortex ». La couche de sortie (neurones moteurs) est connectée au système musculaire.

Lorsque des stimuli arrivent sur les capteurs ceux-ci activent la couche d’entrée et l’influx nerveux se propage de couche en couche jusqu’à la couche de sortie qui active les muscles et donc anime le personnage. La matrice des poids synaptiques ayant été initialisée aléatoirement, les mouvements produits sont arbitraires.

Le rôle d’un apprentissage supervisé est de configurer la matrice afin que les réponses et les entrées soient cohérentes. Pour cela on constitue un ensemble de n couples d’apprentissages

{(E1,S1), (E2,S2), …, (En,Sn)}

constitués d’une entrée Ei et d’une sortie souhaitée Si. On présente l’entrée Ei au système qui fournit une sortie calculée Ci et on cherche à minimiser l’erreur quadratique :

où (oi – ti) est la différence des sorties souhaitée et calculée, pour cela on fait évoluer les poids wij dans la direction inverse du gradient :

 

où n est une constante permettant de moduler la correction (grande au début de l’apprentissage et petite à la fin).

Une méthode récurrente de calcul des signaux d´erreur des cellules d´une couche à partir de ceux de la couche suivante consiste à calculer les signaux d´erreur pour la couche de sortie, puis, de proche en proche en descendant dans les couches, on utilise les signaux d´erreur des cellules de la couche i pour calculer celui de chaque cellule de la couche i-1. D´ou le nom de "rétropropagation de l´erreur " de cet algorithme [7].

Un tel réseau entraîné par cette méthode présente une propriété très remarquable qui est celle dite de « généralisation » : Il sera capable non seulement de fournir la sortie souhaitée pour une entrée apprise,  mais il le fera aussi pour une entrée proche, et il fournira une sortie non arbitraire pour une entrée non apprise. Nous dirons qu’il est capable d’improviser (tout comme un musicien improvise sur des thèmes connus).

Il s’agit là d’une autonomie que nous qualifierons de faible, car elle nécessite qu’un professeur guide le réseau dans son apprentissage.

 

4-2-2 Un exemple d’apprentissage supervisé [6]

 

Les couples d’apprentissage sont de la forme (E,S), où E est une image (capturée par une webcam) et S est une position dynamique constituée d’un ensemble de forces appliquées au système musculaire.

La figure 3 montre la saisie d’une image et de la position correspondante.

La figure 4 montre le processus d’apprentissage après 158 essais, l’erreur est de moins de 5%.

Les figures 5 et 6 montrent la créature virtuelle utilisant son réseau configuré pour interpréter des images non apprises.

 

Figure 3 : saisie d’un couple d’apprentissage    Figure 4 : Apprentissage

 

Figure 5 : activité                                 Figure 6 : activité

 

4-3 Autonomie forte

 

4-3-1 Apprentissage non supervisé

 

La matrice des poids synaptiques d’un réseau multi couches est majoritairement remplie de zéros traduisant le fait qu’un tel réseau est faiblement connecté : en effet, seules les connexions d’une couche à la suivante sont prises en compte, à l’exclusion de toutes les connexions ré-entrantes inverses et internes à une même couche. Or dans les systèmes vivants, ce sont justement ces circuits réentrants qui sont à l’origine des comportements autonomes, Edelman y voit même une des conditions de l’émergence de la conscience [8].

C’est la raison pour laquelle j’ai utilisé des réseaux complètement connectés entraînés par des apprentissages non supervisés.

Kohonen [9] proposa une méthode d´apprentissage non supervisée consistant, pour un réseau, à détecter des régularités dans des configurations présentées en entrées et à les classifier. Il s´agit d´un apprentissage compétitif dans lequel aucun professeur n´est nécessaire, le réseau devant découvrir tout seul des régularités dans les entrées.

 

4-3-2 Résonance neuronale

 

J’ai proposé [10] une méthode d’apprentissage non supervisé basée sur la mise en phase des deux flux d’entrée et de sortie. Cette fois-ci on ne mémorise plus des images figées mises en correspondance avec des positions, mais on utilise une mémoire de travail (de l’ordre de la seconde) qui constitue un flux dont on peut analyser les caractéristiques dynamiques. Présenté en entrée d’un réseau complètement connecté (c’est à dire contenant des boucles réentrantes) il donne lieu à un autre flux, celui des sorties calculées par le réseau, dont on peut aussi analyser les caractéristiques dynamiques. Si l’on prend la différence des phases de ces deux flux comme critère (à minimiser) de l’apprentissage, le réseau s’autoconfigure, en dehors de toute directive extérieure, de façon à rendre cohérentes les variations des entrées et celles des sorties. La figure 7 montre la saisie d’images successives filmées par la webcam. On remarque, sur le schéma représentant le réseau, les connexions réciproques (de la sortie vers l’entrée). Sur la figure 8 on peut voir l’apprentissage consistant à rendre cohérentes les variations de ce film avec l’ensemble des sorties calculées. Sur la figure 9 le réseau interprète des images non apprises.

           

                        Figure 7 : mémoire de travail                            Figure 8 : Cohérence

 

En parallélisant les trois processus (acquisition des entrées, apprentissage et utilisation de la matrice des poids synaptiques) on obtient un fonctionnement dynamique, l’apprentissage se faisant à la volée, en rendant cohérentes les variations du flux d’entrée (images de la webcam) et celles du flux de sortie (forces appliquées au modèle musculaire) . La figure 10 montre le réseau apprenant en même temps qu’il observe et qu’il exécute les mouvements. On peut voir le flux d’entrée en haut (sous la forme d’images instantanées constituant sa mémoire de travail de quelques secondes), et le flux de sortie, juste en dessous (visualisant les forces). On constate que ces deux flux sont en phase. La courbe des erreurs montre le processus d’adaptation.

 

 

Figure 9 : interprétation                        Figure 10 : Apprentissage en action

 

 

5 Conclusion

 

Le concept d’autonomie, central dans le vivant, l’est aussi dans l’artificiel. L’auto organisation d’un système permet de définir la notion de création artificielle dans le domaine des arts numériques.

 

Bibliographie

 

[1] Wiener Norbert: Cybernetics or Control and Communication in the Animal and the Machine, Cambridge Mass, (1948).

 

[2] Andreewsky Evelyne, Delorme Robert: Seconde cybernétique et complexité, rencontre avec Heinz Foerster, L’Harmattan 2006.

 

[3] Couchot Edmond, Tramus Marie-Hélène, Bret Michel, A segunda interatividade. Em direção a novas praticas artisticas 2003 : In Arte vida no século XXI p.27, 38, Diana Domingues,Editora UNESP Saõ Paulo, Brasil.

[4] Varela F.J. , Autonomie et connaissance : essai sur le vivant,  Ed du Seuil, Paris 1989.

[5] Bret Michel, Expérimentation dans les arts du connexionnisme, in ISEA 2000.

[6] Bret Michel, Virtual Living Beings, in Virtual Worlds Jean-Claude Heudin (Ed.), Springer 2000.

 

[7] Abdi Hervé, Les réseaux neuronaux, Presses Universitaires de Grenoble, 1994.

 

[8] Edelman Gerald M., Comment la matière devient conscience, Odile Jacob, 2000.

 

[9] Kohonen T, Self-Organization and Associative Memory, Springer-Verlag 1984.

 

[10] Bret Michel, Emergence et résonance neuronale, décembre 2006.