top of page

DolphinGemma

Dernière mise à jour : 28 avr.



Deux dauphins qui parlent à un plongeur par la magie de l'intelligence artificielle.
Vue d'artiste humoristique ? Déjà générée par IA !

Introduction


À l’heure où l’intelligence artificielle repousse sans cesse les frontières du possible, le projet DolphinGemma va encore un peu plus loin, à la limite du conte de fées…


Jugez plutôt :


Comprendre et traduire le langage des dauphins pour s’adresser à eux en temps réel !


Cette initiative, à peine croyable, fruit d’un partenariat entre Google DeepMind, le Georgia Institute of Technology et le Wild Dolphin Project (WDP) propose d’explorer l’un des mystères les plus fascinants de la communication animale, leur langage.


L’ultime ambition ?


Ouvrir la voie à un dialogue bidirectionnel direct avec les dauphins, grâce à une traduction simultanée entre l’homme et ces créatures marines emblématiques.


Et ce choix ne doit rien au hasard, car de tout temps, les dauphins ont essayé de se rapprocher des hommes, sans oublier que leur intelligence, leur esprit volontiers joueur et leurs vocalises sophistiquées, en faisaient des candidats idéaux.


40 ans d’études !


L'aventure commence en 1985, lorsque le Wild Dolphin Project démarre avec l’observation d'une communauté de dauphins tachetés sauvages de l'Atlantique.


Depuis le début, une très large collecte de données audio, vidéo et comportementales a été entreprise par les chercheurs.


Ces décennies d'observations ont permis de constituer l’un des plus riches ensembles de données sur la communication des dauphins actuellement exploitable.


Cette base précieuse offre aux chercheurs la possibilité d’identifier des motifs sonores récurrents, essentiels à l’hypothèse selon laquelle les dauphins posséderaient un système de communication complexe, aussi capable d’abstraction.


DolphinGemma, une collaboration bienvenue


Avec la convergence des nouvelles technologies informatiques, l’essor de l’intelligence artificielle et la sophistication croissante des grands modèles de langage (LLM) Google DeepMind a vu, dans l’immense fonds d’archives du WDP, une opportunité rare.


Dès le début des années 2020, des discussions se sont donc engagées entre des spécialistes de l’IA, des linguistes, et des biologistes marins, notamment ceux du Georgia Institute of Technology.


L’objectif était de transposer les techniques d’analyse de séquences — déjà éprouvées dans le traitement informatique du langage humain — vers l’interprétation des vocalisations purement "delphiniennes".


Les synergies entre la recherche historique du WDP et le savoir-faire technique de ces spécialistes ont constitué le terreau fertile qui allait donner naissance à la jeune pousse Dolphin Gemma, un projet, à note connaissance, unique au monde.


Concrétisation


En avril 2025, lors de la journée nationale des dauphins aux États-Unis, Google DeepMind annonçait le lancement officiel de ce projet en étroite collaboration avec les chercheurs déjà cités du Georgia Institute of Technology et les spécialistes du Wild Dolphin Project.


Cette association assure non seulement une exploitation optimale des décennies de données recueillies, mais favorise également l’innovation technique en intégrant des perspectives scientifiques variées, qui vont de l’IA de pointe à l’éthologie marine.


Et techniquement ?


S’inspirant de la famille des modèles Gemma de Google, DolphinGemma adopte une architecture allégée, spécialement conçue pour être déployée sur des dispositifs mobiles, comme les smartphones.


Grâce à un module inédit nommé SoundStream, capable de transformer les clics, sifflements et autres vocalisations en séquences numériques, le modèle interprète et anticipe les suites sonores générées par les dauphins ; la technique utilisée est une fonction d’autocomplétion classique à l’œuvre dans les IA génératrices actuelles.


Avec environ 400 millions de paramètres, le système offre ainsi une performance exceptionnelle, tout en restant suffisamment compact pour être exploité sur le terrain. Il s'appuie sur un LLM spécialement entraîné avec des spectrogrammes de sons produits par les dauphins.


Ce modèle fonctionne comme un ChatGPT spécialisé, capable de prédire des séquences acoustiques probables et d'imiter la façon dont les dauphins interagissent entre eux, avant que les éthologues marins en déduisent des significations pertinentes.



Méthodologie


Plutôt que de simplement traduire leur langage naturel, les scientifiques ont conçu des sifflements synthétiques associés à des objets ou des animaux que les dauphins apprécient, comme des algues, des harengs, ou des herbiers marins.


Ces sons sont ensuite testés pour voir si les dauphins les adoptent et les utilisent dans leurs interactions sur ces sujets précis, ce qui pourrait signifier une structure identique à leur langage.


Cette approche technique permet non seulement de déchiffrer, mais aussi de reproduire des structures sonores de la communication naturelle des dauphins.


Au-delà du simple décodage, DolphinGemma ambitionne donc de repousser les limites de notre interaction avec la nature, et, dans le cas présent, avec les dauphins comme terrain d’expérimentation.


L’objectif ?


Imaginez un dispositif, un smartphone modifié sous un casque, qui non seulement interpréterait les séquences sonores des dauphins, mais permettrait aussi d’y répondre, ouvrant ainsi la porte à des échanges en temps réel, aussi riches qu'interactifs !


Si la communauté scientifique reste divisée quant à la nature « linguistique » des vocalisations des dauphins – certains remettent en question l’existence d’une grammaire comparable à celle du langage humain – l’initiative reste un tremplin formidable pour explorer les subtilités des communications intra, voire interespèces, et enrichir notre compréhension des comportements de ces animaux marins.


Perspectives


Pourtant, malgré l'envie d'y croire, le chemin vers une traduction réelle du langage des dauphins reste semé d’embûches.


La complexité des environnements sonores sous-marins, la variabilité des signaux acoustiques et la difficulté d’extraire des structures linguistiques pertinentes à partir de données brutes représentent des défis majeurs.


Sans même parler de l’absence d’un dauphin bilingue et collaboratif pour valider les progrès !


Toutefois, en combinant l’héritage historique du Wild Dolphin Project et les techniques d’IA de pointe, DolphinGemma ouvre des perspectives inédites.


Les retombées potentielles pourraient transformer notre relation avec la nature en offrant une meilleure compréhension des interactions sociales des dauphins.


Mais aussi, inspirer des recherches sur d’autres espèces dotées de systèmes de communication complexes, comme l’ensemble des cétacés, sans oublier les primates et les oiseaux, pour ne citer qu’eux…


Conclusion


DolphinGemma se présente comme l’un des projets les plus captivants de notre époque, alliant technologie, histoire scientifique et esprit de collaboration interdisciplinaire, sans oublier un peu de magie !


Que l’objectif ultime de converser directement avec ces mammifères aquatiques se réalise ou non, DolphinGemma marque une étape essentielle dans notre quête pour comprendre la nature et repousser les frontières du langage, et peut-être nous inciter à repenser notre place au sein de cet écosystème…


… Car si les animaux pouvaient s’adresser directement à nous, nul doute que leurs paroles ne seraient pas que miel !

Commentaires


bottom of page