Google KI entschlüsselt Delfin-Sprache auf Pixel?

Google stellt DolphinGemma vor, eine KI zur Entschlüsselung der komplexen Delfinkommunikation. In Zusammenarbeit mit Forschern und basierend auf jahrzehntelanger Datensammlung, läuft das Modell sogar auf Pixel-Telefonen. Dies könnte den Weg für eine interspezifische Kommunikation ebnen.

Google hat in Kooperation mit der Georgia Tech und dem Wild Dolphin Project (WDP) ein neues KI-Modell vorgestellt: DolphinGemma. Ziel ist es, die komplexe Kommunikation von Delfinen zu entschlüsseln. Diese Entwicklung stellt einen bedeutenden Fortschritt in der interspezifischen Kommunikationsforschung dar und könnte eine tiefere Verbindung zwischen Mensch und Delfin ermöglichen. Das Projekt nutzt jahrzehntelange Forschungsdaten und modernste KI-Technologie, um die Geheimnisse der Delfinlaute zu lüften und potenziell eine neue Ära des Verständnisses einzuläuten.

Grundlage ist die einzigartige Datensammlung des WDP, das seit 1985 Atlantische Fleckendelfine in den Bahamas erforscht. Die Sammlung umfasst Dekaden von Unterwasser-Video- und Audiodaten, verknüpft mit individuellen Delfinidentitäten, Lebensgeschichten und Verhaltensweisen. Diese detaillierte Dokumentation ist entscheidend, da sie es Forschern ermöglicht, Lautäußerungen direkt mit spezifischen Verhaltensweisen und den beteiligten Individuen zu korrelieren, was an der Oberfläche unmöglich wäre. Das Verständnis der sozialen Struktur ist hierbei zentral.

Bestimmte Lauttypen wurden bereits mit Verhaltenskontexten korreliert: Signature Whistles zur Mutter-Kalb-Kommunikation, Burst-Pulse „Squawks“ bei Kämpfen und Click „Buzzes“ bei Balz oder Jagd.

Die Analyse dieser komplexen Kommunikation ist eine monumentale Aufgabe. Hier kommt DolphinGemma ins Spiel, entwickelt von Google unter Einsatz spezifischer Audio-Technologien. Ein SoundStream-Tokenizer wandelt Delfinlaute effizient um, die dann von einer für komplexe Sequenzen optimierten Modellarchitektur verarbeitet werden. Mit rund 400 Millionen Parametern ist das Modell ideal für den mobilen Einsatz auf Pixel-Telefonen dimensioniert, die das WDP im Feld verwendet, was die Datenerfassung und -analyse direkt vor Ort ermöglicht.

DolphinGemma basiert auf Googles offenen Gemma-Modellen und wurde intensiv auf der akustischen Datenbank des WDP trainiert. Es fungiert als Audio-Eingabe/Audio-Ausgabe-Modell: Es analysiert Sequenzen natürlicher Delfinlaute, um Muster, Strukturen und wahrscheinliche Folgelaute vorherzusagen. Dies ähnelt stark der Funktionsweise großer Sprachmodelle (LLMs) für menschliche Sprache, die das nächste Wort in einem Satz prognostizieren. Ziel ist das tiefere Verständnis der Struktur von Delfinlauten.

Die WDP setzt DolphinGemma bereits in dieser Feldsaison ein und erwartet sofortige Vorteile. Das Modell kann wiederkehrende Lautmuster, Cluster und zuverlässige Sequenzen identifizieren und so verborgene Strukturen aufdecken – eine Aufgabe, die bisher immensen menschlichen Aufwand erforderte. Langfristig könnten diese Erkenntnisse, ergänzt durch synthetische Laute für Objekte, mit denen Delfine interagieren, helfen, ein gemeinsames Vokabular für die interaktive Kommunikation zwischen Mensch und Delfin zu etablieren.

Google plant, DolphinGemma im Sommer als Open-Source-Modell der Forschungsgemeinschaft zur Verfügung zu stellen. Obwohl auf Atlantischen Fleckendelfinen trainiert, könnte es nach Feinanpassung (Fine-Tuning) auch für andere Arten wie Orcas oder Spinnerdelfine nützlich sein. Die offene Bereitstellung soll Forschern weltweit ermöglichen, eigene akustische Datensätze zu analysieren und das Verständnis dieser intelligenten Meeressäuger gemeinsam zu beschleunigen und voranzutreiben.

Trotz der Fortschritte bleiben erhebliche Herausforderungen. Experten warnen, dass Delfine möglicherweise keine „Wörter“ im menschlichen Sinne nutzen. Menschliche Sprache besitzt komplexe Grammatik und unbegrenzte Strukturen, während Delfinlaute eher Signale sein könnten. Dennoch ist das Erkennen von Mustern und die Reaktion auf Laute ein wertvolles Fenster zu ihren kognitiven Fähigkeiten, wie Gedächtnis und Lernen. Ähnliche Projekte untersuchen Krähen und Pottwale.