Nouvelle génération de modèles linguistiques inspirés par l'humain

Un ordinateur peut-il apprendre une langue comme le fait un enfant ? Une étude récente menée par l’UNamur et la VUB apporte un nouvel éclairage sur cette question, avec une révision fondamentale de la manière dont l'IA acquiert et traite le langage.

Mots clés: #IA, #linguistique, #modèle

Lire plus

research

( Photo: MIT Press Direct (Creative Commons Attribution 3.0 or 4.0 License) )

ENGINEERINGNET.BE - Il s’agit d’une étude récente publiée dans la revue de référence Computational Linguistics par les professeurs Katrien Beuls (Université de Namur) et Paul Van Eecke (AI-lab, Vrije Universiteit Brussel).

"Les enfants apprennent leur langue maternelle en communiquant avec les personnes de leur environnement. Ce processus, dans lequel le langage est acquis par l'interaction et un contexte significatif, constitue le cœur de l'acquisition du langage humain", explique Katrien Beuls.

"La génération actuelle de grands modèles linguistiques (LLMs), comme ChatGPT, apprend le langage d'une manière très différente", poursuit Paul Van Eecke.

En observant dans d'énormes quantités de texte quels mots apparaissent souvent à proximité les uns des autres, ces modèles apprennent à générer des textes qui sont souvent indiscernables des textes humains.

Cela conduit à des modèles extrêmement puissants dans de nombreuses formes de génération de texte, mais qui présentent en même temps un certain nombre de limitations inhérentes. Ils nécessitent en outre d'énormes quantités de données et d'énergie pour être construits et utilisés."

Les chercheurs proposent un modèle alternatif dans lequel des agents artificiels apprennent le langage comme le font les humains : en participant à des interactions communicatives significatives dans leur environnement.

Dans une série d'expériences, ils montrent comment ces agents développent des constructions linguistiques directement liées à leur environnement et à leurs perceptions sensorielles.

Cela conduit à des modèles linguistiques basés sur une interaction directe avec le monde. Ces modèles laissent par ailleurs une empreinte écologique plus petite. Enfin, ils permettent de comprendre le langage et le contexte de manière plus humaine.

L'intégration des interactions communicatives et situées dans les modèles d'IA est une étape cruciale dans le développement de la prochaine génération de modèles linguistiques.

Cette recherche offre une voie prometteuse vers des technologies linguistiques qui se rapprochent de la manière dont les humains comprennent et utilisent le langage.