Les agents génératifs : simuler des comportements humains réalistes grâce à l’IA générative

Nicolas Spatola, Chercheur chez Artimon Perspectives

Nicolas SPATOLA

Chercheur

L’IA générative pourrait nous aider à mieux comprendre les comportements humains en permettant à des agents virtuels de simuler des comportements réalistes dans des environnements numériques. Des chercheurs de l’université de Stanford ont récemment utilisé des technologies algorithmiques pour créer une communauté d’agents virtuels capables de planifier leur journée, de mémoriser des événements, et d’interagir de manière sociale dans un environnement inspiré du jeu Les Sims. Cette avancée ouvre de nouvelles perspectives dans des domaines tels que la psychologie sociale, l’apprentissage automatique et la robotique, et de manière plus générale dans la création d’agents artificiels et la modélisation des comportements humains.

L’architecture des agents génératifs

Les chercheurs ont développé une architecture pour permettre aux agents génératifs de simuler des comportements humains réalistes. Cette architecture s’appuie sur un modèle de langage qui enregistre l’ensemble des expériences de l’agent dans un flux de mémoire. Les agents perçoivent leur environnement et enregistrent toutes leurs perceptions dans ce flux de mémoire. En utilisant ces perceptions enregistrées, les agents peuvent récupérer des souvenirs pertinents pour le contexte, planifier des actions à long terme et réfléchir sur leur expérience passée. Encore plus intéressant, ces comportements se déploient à des niveaux individuels et sociaux.

Fig.1 Architecture d’agent génératif. Les agents perçoivent leur environnement et toutes les perceptions sont enregistrées dans un enregistrement complet des expériences de l’agent appelé flux de mémoire. Extrait de l’article de recherche.

Une simulation interactive inspirée de The Sims

Pour ce faire, les chercheurs ont créé un environnement interactif inspiré du jeu The Sims. Cet environnement comprend 25 agents génératifs dotés de personnalités, de préférences, de compétences et d’objectifs de vie différents. Les utilisateurs peuvent observer et interagir avec ces agents alors qu’ils planifient leur journée, partagent des informations, forment des relations et coordonnent des activités de groupe. Cette simulation permet de mettre en évidence les capacités des agents génératifs à produire des comportements sociaux émergents et réalistes.

L’étude a par exemple mesuré la diffusion de deux informations spécifiques sur deux jours dans le monde du jeu : la candidature de Sam à la mairie du village et la fête de la Saint-Valentin d’Isabella au Hobbs Cafe. Au début de la simulation, les deux informations n’étaient connues que de leurs auteurs respectifs, Sam pour la candidature et Isabella pour la fête, car elles ont été ajoutées à la mémoire des personnages lors de l’initialisation. Au cours des deux jours de simulation, le nombre d’agents au courant de la candidature de Sam à la mairie du village est passé de un (4%) à huit (32%), et le nombre d’agents au courant de la fête de la Saint-Valentin d’Isabella est passé de un (4%) à treize (52%), le tout sans aucune intervention humaine subséquente.

Les chercheurs ont également examiné la formation de relations entre les agents en interrogeant chaque agent sur sa connaissance de tous les autres agents. L’étude a considéré qu’une paire d’agents avait formé une relation s’ils se connaissaient tous les deux. Par exemple, à la question « Connaissez-vous Maria Lopez ? », Klaus a répondu : « Oui, je connais Maria Lopez. C’est une étudiante du Oak Hill College avec laquelle je suis très ami. » L’étude a montré que le nombre de relations formées entre les agents était passé de 0 à 23 (92%) au cours de la simulation.

La dernière variable d’intérêt était la coordination des agents dans le contexte d’activités de groupe, en particulier la fête de la Saint-Valentin organisée par Isabella. Le jour de la Saint-Valentin, cinq des douze agents invités se sont présentés au café Hobbs pour participer à la fête. En creusant les raisons de l’absence des sept agents qui avaient été invités à la fête mais n’y étaient pas allés, un entretien avec eux a révélé que trois d’entre eux s’étaient retrouvés face à des conflits qui les avaient empêchés de participer. Pour les quatre autres, ils ont exprimé leur intérêt pour la fête, mais n’avaient simplement pas prévu de venir.

Les agents génératifs sont des simulacres crédibles du comportement humain pour les applications interactives. Dans ce travail, nous faisons la démonstration d'agents génératifs en peuplant un environnement de bac à sable, rappelant Les Sims, avec vingt-cinq agents. Les utilisateurs peuvent observer et intervenir pendant que les agents planifient leurs journées, échangent des nouvelles, nouent des relations et coordonnent des activités de groupe.
Fig. 2 Visuel extrait de l’étude. « Les agents génératifs sont des simulacres crédibles du comportement humain pour les applications interactives. Dans ce travail, nous faisons la démonstration d’agents génératifs en peuplant un environnement de bac à sable, rappelant Les Sims, avec vingt-cinq agents. Les utilisateurs peuvent observer et intervenir pendant que les agents planifient leurs journées, échangent des nouvelles, nouent des relations et coordonnent des activités de groupe. »

La question qui se pose à la suite de cette étude est la possibilité de modéliser des environnements numériques ayant une “vie” informatique ou de créer des doubles numériques de systèmes fermés, à la manière d’une téléréalité dans laquelle on projetterait des versions numériques issues des données partagées par les individus sur des plateformes, réseaux sociaux, etc. Les intérêts pour la recherche académique incluent la création de modèles multi-agents boostés par l’IA générative, servant à l’étude des groupes sociaux notamment. On peut également envisager de simuler les interactions entre individus pour anticiper qui pourrait le mieux s’associer avec qui dans une organisation. Bien que ces modèles ne soient pas pour demain, la tentation de considérer un cadre social comme un pur environnement informationnel reste séduisante, en raison des promesses de réduction d’incertitude et de contrôle sur ces dits environnements. En cela, les écrits de Norbert Wiener, bien que datant de l’après-guerre, demeurent très éclairants et soulèvent des limites fondamentales à considérer que nous adresserons dans un prochain article.

En effet, il reste important de penser les limites et objets de ces technologies. Or, plus l’accélération est importante, plus il est difficile de mener cette réflexion, alors que la nécessité de la mener accroît et qu’elle devient essentielle. Cela ne signifie pas penser par principe contre la technique, mais signifie « penser les utilisations » plutôt que le « faire ». Pour citer Jacque Ellul :

« Aujourd’hui, le moyen se justifie par lui-même, on a dépassé le temps du principe « la fin justifie les moyens ». Bien entendu, il y a encore des (gens) qui soutiennent cette idée (…). Mais en réalité, tout cela, c’est de l’idéologie, en accord avec une époque où l’homme était (encore) maître, spirituellement et matériellement, de ses moyens, où il avait le choix entre plusieurs sortes de moyens (…). Est déclaré « bien » ce qui réussit, “mal” ce qui échoue. (…) Aucun jugement de valeur n’est porté sur un moyen technique. »

Référence

Park, J. S., O’Brien, J. C., Cai, C. J., Morris, M. R., Liang, P., & Bernstein, M. S. (2023). Generative agents: Interactive simulacra of human behavior. arXiv preprint arXiv:2304.03442

Articles similaires