Création, émergence, autonomie

 

Rencontres sur La réalité virtuelle et les arts numériques

organisées par ATI de l’Université Paris 8 et le Centre des Art d’Enghien:

mars 2007 à l’auditorium du Centre des Art d’Enghien (9h-18h)

 

Michel Bret, professeur émérite, ATI, Université Paris8, mars 2007

 

 

Mots clés : Apprentissage, autonomie, cohérence de flux, création, émergence, réseaux neuronaux.

 

1 Résumé

 

         L’homéostasie est insuffisante pour expliquer les comportements adaptatifs des organismes évolués, l’auto organisation des systèmes complexes permet de construire des êtres artificiels dotés d’autonomie. On montrera, à travers 3 exemples d’apprentissages (supervisé, non supervisé autour de la cohérence de flux, et reconnaissance de régularités) que création, émergence, autonomie et réentrance sont des notions fortement liées.

 

2 Introduction

 

Les deux cybernétiques avaient successivement introduit la notion d’homéostasie puis d’auto organisation. Appliquées au développement d’êtres artificiels autonomes ces notions, dans un contexte connexionniste, conduisent à envisager différents types d’apprentissage sur des réseaux neuronaux (supervisés et non supervisés). Si la perception d’un organisme n’est que celle des effets de l’action qu’il produit dans son environnement, il n’y a de perception qu’informée, dès lors les comportements autonomes, pour exister, devront nécessairement émerger d’une interaction comportementale impliquant la reconnaissance de régularités remarquables associées à des actions de survie.

 

3 Emergence et autonomie

 

La première cybernétique [1] avait introduit la notion d’homéostasie comme régulation des systèmes naturels et artificiels (par la boucle rétroactive).

Heinz von Foerster [2] a contribué aux approches des systèmes complexes en créant la cybernétique des systèmes observants (seconde cybernétique), et a participé à la théorie de l´autoorganisation en relation avec l´autoréférence et la transdisciplinarité.

Dans le premier cas un robot préprogrammé tente de maintenir constants ses paramètres vitaux dans un environnement changeant, alors que, dans le deuxième cas, l’organisme s’auto organise pour s’adapter. Afin de pouvoir répondre correctement à des conditions imprévisibles, donc inconnues à priori, les comportements d’un organisme artificiel ne sauraient être programmés d’avance, celui ci doit donc être muni d’une certaine autonomie lui permettant de prendre des décisions en dehors de toute intervention humaine. C’est la raison pour laquelle les stratégies d’apprentissages supervisés sont insuffisantes et qu’il est nécessaire de s’orienter vers des systèmes autonomes apprenant en permanence de façon non supervisée, c’est à dire sans professeur.

La création fait nécessairement référence à l’autonomie, en effet seul un être autonome peut inventer car, s’il était inféodé à son environnement, il ne pourrait ni produire, ni même imaginer, quoi que ce soit qui n’y existe déjà. Les comportements créatifs sont émergents dans un système neuronal, les notions de création, d’émergence et d’autonomie sont donc fortement liées. Je montrerai aussi que le degré de réentrance d’un système neuronal est directement lié à la force de l’émergence, Edelman [3] voit même dans cette réentrance une condition de l’apparition de la conscience.

 

4 Exemple d’apprentissage supervisé

 

L’algorithme de la rétropropagation de l’erreur [4] travaille sur des réseaux multi couches connectées de l’entrée vers les couches cachées puis vers la sortie, sans connexions arrières. A partir d’un ensemble de couples d’apprentissage (entrée – sortie souhaitée), il présente successivement au réseau les entrées pour produire des sorties calculées (obtenues en propageant l’activation des neurones, de couche en couche, en utilisant la matrice des poids synaptiques, initialisée aléatoirement). Les différences entre les sorties souhaitées et les sorties calculées sont considérées comme des erreurs servant à modifier les poids synaptiques.

Une simple web cam nous servira d’œil artificiel, lequel est greffé sur un acteur artificiel muni d’un système perception – action sous la forme suivante [5] :

Un corps est construit sur un squelette articulé rigide sur lequel viennent s’attacher des muscles, une peau souple recouvre l’ensemble (seule cette peau est affichée mais sa forme dépend de celle des muscles et des os). Son « cerveau » est constitué de réseaux neuronaux dont les entrées sont connectées à des capteurs (organe des sens) et dont les sorties (neurones moteurs) agissent sur les muscles.

La figure 1 illustre ce qui se passe lorsqu’une main par exemple est placée face à la caméra : Une image rétinienne se forme, chaque pixel de la rétine est connecté à un neurone de la couche d’entrée et l’activation de ces neurones est passée aux couche cachées puis à la couche de sortie (via la matrice des poids synaptiques que l’on peut voir sur la figure 2), les neurones moteurs ainsi activés provoquent des mouvements musculaires et donc l’animation du corps.

La figure 3 montre l’acquisition d’un couple d’apprentissage : Une image est présentée à la caméra en entrée, et une position du corps est générée en sortie.

L’apprentissage est visualisé sur la figure 4, la courbe d’erreur tend à se rapprocher de l’axe horizontal (erreur de plus en plus petite).

Enfin le réseau en action apparaît sur la figure 5 : Les images de la web cam sont captées par la couche d’entrée, le réseau délivre les positions de sorties calculées à travers la matrice entraînée. Les entrées apprises sont bien reconnues et des entrées non apprises donnent des sorties cohérentes (propriété de généralisation des réseaux).

Ce système constitue un puissant outil de chorégraphie : Il suffit de danser devant la caméra pour entraîner le réseau, le danseur artificiel est ensuite capable d’improviser en interagissant avec le danseur réel.

 

5 Apprentissage non supervisé

 

5-1 Apprentissage compétitif

 

Des apprentissages de type compétitif sont mis en œuvre dans les réseaux de Kohonen [6] qui détectent des régularités dans des configurations présentées en entrées et les classifient. La donnée d’une topologie des connexions et d’une distance sur les neurones constitue la mappe de Kohonen. L´apprentissage consiste en une compétition des neurones de la couche de sortie qui élisent un neurone vainqueur, puis un processus de concurrence entre neurones élus affine la recherche.

           

5-2 Cohérence de flux

 

L’algorithme de la rétropropagation de l’erreur donne de très bons résultats mais présente certains inconvénients : D’abord il suppose un apprentissage supervisé (donné sous la forme de couples entrées-soties), ensuite il converge assez lentement, enfin il ne répond pas du tout à la réalité biologique (on sait que les systèmes nerveux des organismes vivants sont massivement réentrants).

J’ai développé une méthode [7] basée sur la mise en phase de deux flux : L’organisme artificiel perçoit de son environnement le résultat des actions qu’il y entreprend, on peut concevoir qu’il est bien adapté lorsque le flux de ses actions est en phase avec le flux de ses perceptions.

Les images successives de la capture d’une scène réelle par la caméra constituent un flux de données dont on peut analyser les caractéristiques dynamiques. Présenté en entrée d’un réseau complètement connecté (c’est à dire contenant des boucles réentrantes) il donne lieu à un autre flux, celui des sorties calculées par le réseau, dont on peut aussi analyser les caractéristiques dynamiques. Si l’on prend la différence des phases de ces deux flux comme critère (à minimiser) de l’apprentissage, le réseau s’auto-configure, en dehors de toute directive extérieure, de façon à rendre cohérentes les variations des entrées et celles des sorties.

On utilisera des réseaux complètement connectés pour lesquels existent des connexions réentrantes, toute boucle possède un « retard » qui en fait un système dynamique non linéaire, régi par des équations différentielles. Il s’agit là d’une auto-organisation au sens fort caractérisée par l´absence de but prédéfini et l´émergence de ce qui sera considéré, après coup, comme un comportement fonctionnel, c´est-à-dire ayant un sens.

La figure 6 montre un tel réseau, son entrée est le contenu d’une mémoire de travail (de quelques secondes) pour laquelle il calcule un flux de sortie. On remarque, sur le schéma représentant le réseau, les connexions réciproques (de la sortie vers l’entrée).

L’apprentissage (voir figure 7) consiste à modifier les poids synaptiques de façon à rendre cohérents les deux flux (d’entrée et de sortie), nous faisons l’hypothèse que le déphasage est une mesure de l’erreur commise.

La figure 8 montre le réseau en action utilisant la matrice entraînée.

En parallélisant les trois processus (acquisition des entrées, apprentissage et utilisation de la matrice des poids synaptiques) on obtient un fonctionnement dynamique, l’apprentissage se faisant à la volée, en rendant cohérentes les variations du flux d’entrée (images de la webcam) et celles du flux de sortie (forces appliquées au modèle musculaire) . La figure 9 montre le réseau apprenant en même temps qu’il observe et qu’il exécute les mouvements. On peut voir le flux d’entrée en haut (sous la forme d’images instantanées constituant sa mémoire de travail de quelques secondes), et le flux de sortie, juste en dessous (visualisant les forces). On constate que ces deux flux sont en phase. La courbe des erreurs montre le processus d’adaptation.

 

6 Reconnaissance de régularités

 

6-1 Reconnaissance de figures

 

         Une amélioration de l’apprentissage supervisé présenté au paragraphe 4 consiste à faire découvrir par le réseau lui-même les couples à partir desquels il pourra s’auto configurer :

         Une analyse du flux d’entrée permet d’extraire, et de mémoriser, des images remarquables, ce seront celles assez différentes des images déjà mémorisées. La figure 10 fait voir une image (colorée en rouge) ainsi extraite.

            Pour compléter les couples d’apprentissage on pourrait associer manuellement à chacune de ces images une position, c’est ce que montre les figures 11 et 12.

            Les résultats (voir figures 13 et 14), sont intéressants, mais il reste qu’un professeur continue d’indiquer les correspondances entre les entrées et les sorties.

 

6-2 Reconnaissance de mouvements

 

         Selon Alain Berthoz [8], le mouvement serait à l’origine des comportements les plus évolués des êtres vivants, nous remplaceront donc la perception d’images par celle de scènes animées.

         Utilisons une mémoire de travail pour stocker, non plus une image, mais un mouvement continu (de quelques secondes). Une analyse d’échantillons successifs permet d’extraire, et de mémoriser, certains mouvements, ceux assez différents des échantillons déjà sélectionnés (voir figure 15).

Le  réseau en action cherche alors à reconnaître, dans son flux d’entrée, des mouvements remarquables qu’il a sélectionné antérieurement, il s’agit là d’une « perception informée », la  reconnaissance de la réalité étant remplacée par la connaissance antérieure d’une perception proche, le réseau se comportera alors comme s’il percevait celle-ci.

Ce fonctionnement est à rapprocher de la différence que fait Damasio [9] entre mémoire de travail et mémoire somatique.

Cela suppose que le réseau est doté de comportements appris ailleurs. On peut définir par exemple des apprentissages de rééquilibrage : le corps, placé dans un champ de pesanteur est soumis à des contraintes physiques (sol, corde, trapèze, …),  perçoit son environnement (au moyen de capteurs) et il tente de se maintenir en équilibre ou de faire des figures (danse, acrobaties, …). Certaines lois de la biomécanique permettent de générer des mouvements à partir d’un ensemble réduit de paramètres, comme par exemple la loi de la puissance un tiers, celle du plan de phase ou celle de l’opposition de phase [10]. Ainsi, à des séquences animées captées par la caméra, se trouvent associés des comportements.

La figure 16 montre, en entrée dans la mémoire de travail, un mouvement périodique vertical, le réseau reconnaît un échantillon qu’il a déjà stocké (pourvu qu’un tel mouvement lui ait été montré plusieurs fois). La figure 17 montre la reconnaissance d’un mouvement périodique latéral. Mais un organisme biologique ne cesse d’apprendre tout en se comportant, on se rapproche d’un tel fonctionnement  en rendant simultanées les deux actions de mémorisation et de reconnaissance (voir figure 18): Dans ce cas la mémoire de stockage des mouvements remarquables s’agrandit lors de l’interaction, un processus d’ « oubli » permet de contenir cette mémoire dans des limites permettant les calculs en un temps raisonnable.

 

7 Conclusion

 

         Les trois exemples présentés auront permis de comprendre qu’un système artificiel ne peut être créatif que s’il est autonome, et que l’émergence de cette autonomie est directement liée à la notion de réentrance. C’est par une perception informée, s’appuyant sur des expérimentations interactives, qu’un tel système peut construire de la nouveauté, peut-être en est-il ainsi pour les artistes ?

 

Bibliographie

 

[1] Wiener Norbert: Cybernetics, or Control and Communication in the Animal and the Machine, John Wiley Editor, New York, 1948

[2] Andreewsky Evelyne, Delorme Robert, Seconde cybernétique et complexité : Rencontres avec Heinz von Foerster , l’Harmattan 2006

[3] Edelman Gerald M., Comment la matière devient conscience, Odile Jacob, 2000.

[4] Abdi Hervé, Les réseaux neuronaux, Presses Universitaires de Grenoble, 1994

[5] Bret Michel, Virtual Living Beings, in Virtual Worlds Jean-Claude Heudin (Ed.), Springer 2000.

[6] Kohonen T., Self-Organizing Maps , Springer-Verlag 2001

[7] Bret Michel : Emergence et résonance neuronale, décembre 2006

[8] Berthoz Alain: Le sens du mouvement, Editions Odile Jacob Sciences, 1997.

[9] Damasio ANtonio: L’erreur de Descartes, Odile Jacobe 1994..

[10] Bret Michel, Tramus Marie-Hélène, Berthoz Alain: interacting with an intelligent dancing figure, Leonardo vol 38, n° 1, pp 47-54

 

Figures

 

 

 

Figure 1,2 : Activation de la couche d’entrée et matrice des poids synaptiques

 

 

Figure 3 : Saisie d’un couple d’apprentissage

 

 

 

Figures 4,5 : Apprentissage et réseau en action

 

 

 

Figure 6,7 : Flux d’entrée d’un réseau complètement connecté et apprentissage

 

 

 

Figure 8,9 : Réseau en action et simultanément en apprentissage

 

 

Figure 10 : Saisie d’une position remarquable

 

 

 

Figures 11,12 : Associations de mouvements à des positions

 

 

 

Figures 13,14 : Reconnaissance de positions

 

 

Figure 15 : Saisie d’un mouvement remarquable

 

 

 

Figure 16,17 : Des mouvements périodiques (vertical et latéral) sont reconnus

 

 

Figure 18 :Mémorisation et reconnaissance simultanées