Google AI hört 15 Jahre lang Meeresaufnahmen von Sea-Bottom auf versteckte Walgesänge – TechCrunch


Google und eine Gruppe von Spieleketologen hat eine KI-basierte Untersuchung der Unterwasseraufnahmen von Jahren durchgeführt, in der Hoffnung, ein maschinelles Lernmodell zu entwickeln, das Buckelwale-Aufrufe erkennen kann. Es ist Teil des neuen „AI for social good“ -Programms des Unternehmens, das offensichtlich der Tatsache widerspricht, dass AI hauptsächlich für die Gesichtserkennung und das Targeting von Anzeigen verwendet wird.

Wale reisen viel, weil sie nach besseren Futterplätzen, wärmeren Gewässern und gesellschaftlichen Zusammenkünften suchen. Natürlich können diese Bewegungen ziemlich schwer zu verfolgen sein. Glücklicherweise rufen Wale einander an und singen auf individuell identifizierbare Weise, und diese Lieder können unter Wasser große Entfernungen zurücklegen.

Mit einem weltweiten Netzwerk von Abhörgeräten auf dem Meeresgrund können Sie Walbewegungen verfolgen – wenn Sie jahrelang Hintergrundgeräusche hören und die Anrufe manuell auswählen möchten. Und so haben wir es schon eine ganze Weile gemacht, obwohl Computer dazu beigetragen haben, die Last zu erleichtern. Das Team von Google entschied in Zusammenarbeit mit NOAA, dass dies gut zu den Talenten von Machine Learning-Systemen passt.

Diese KI-Modelle (wir verwenden hier den Begriff "lose") eignen sich hervorragend dazu, Tonnen von geräuschvollen Daten nach bestimmten Mustern durchzugehen, weshalb sie auf umfangreiche Daten wie die von Radioteleskopen und CCTV-Kameras angewendet werden.

In diesem Fall handelte es sich bei den Daten um Jahre von Aufnahmen von einem Dutzend Hydrophone, die im gesamten Pazifikraum stationiert waren. Dieser Datensatz wurde bereits weitgehend untersucht, aber die Google-Forscher wollten wissen, ob ein KI-Agent die mühsame und zeitaufwändige Arbeit eines ersten Durchlaufs erledigen und Perioden mit interessantem Klang mit einem Artennamen markieren kann – in diesem Fall Buckelkugeln , aber es könnte genauso gut ein anderer Wal sein oder etwas anderes.

Spektrogramme des Walgesangs (links), ein unbekanntes "schmalbandiges" Rauschen (Mitte) und die Festplatte des Recorders (rechts).

Interessanterweise, aber nicht überraschend im Nachhinein, wurde das Audio nicht als solches analysiert. Stattdessen wurde das Audio in Bilder umgewandelt aussehen for pattern in. Diese Spektrogramme sind eine Aufzeichnung der Tonstärke in einem Frequenzbereich über die Zeit und können für alle Arten von interessanten Dingen verwendet werden. Es kommt daher vor, dass sie auch von Forschern für maschinelles Lernen und Computer Vision untersucht werden, die verschiedene Methoden entwickelt haben, um sie effizient zu analysieren.

Das Modell des maschinellen Lernens wurde mit Beispielen für Buckelwale-Aufrufe versehen und lernte, sie in einem Satz von Beispieldaten mit angemessener Genauigkeit zu identifizieren. Es wurden verschiedene Experimente durchgeführt, um herauszufinden, welche Einstellungen optimal waren – beispielsweise welche Länge des Clips leicht zu verarbeiten war und nicht zu lang war oder welche Frequenzen sicher ignoriert werden konnten.

Die letzte Anstrengung teilte die Datenjahre in 75-Sekunden-Clips und das Modell konnte mit einer Genauigkeit von 90 Prozent feststellen, ob ein Clip eine „Buckeleinheit“ oder einen relevanten Walklang enthielt. Das ist natürlich kein kleiner Fehler, aber wenn Sie der Maschine etwas vertrauen, sparen Sie viel Zeit – oder die Zeit Ihres Laborassistenten.

Eine zweite Anstrengung stützte sich auf das, was als unbeaufsichtigtes Lernen bezeichnet wurde, wobei das System seine eigenen Regeln darüber formulierte, welche Ähnlichkeit zwischen Wal- und Nicht-Walgeräuschen bestand, und so eine Handlung erstellte, die Forscher sortieren und relevante Gruppen finden konnten.

Visualisierung, wie das unbeaufsichtigte Modell verschiedene Geräusche klassifiziert. Die blauen stehen für Buckelaufrufe.

Es macht interessantere Visualisierungen, aber es ist schwieriger zu erklären, und es scheint jedenfalls nicht so nützlich gewesen zu sein, eine Reihe von Klassifizierungen wie die traditionellere Methode.

Ähnlich wie bei ähnlichen Anwendungen des maschinellen Lernens in verschiedenen wissenschaftlichen Bereichen wird dies nicht die sorgfältige Beobachtung und Dokumentation ersetzen, sondern eher ergänzen. Wenn man sich etwas aus der Wissenschaft macht, können sich die Forscher auf ihre Spezialgebiete konzentrieren, anstatt sich in sich wiederholenden Statistiken und stundenlangen Datenanalyse-Sitzungen zu verlieren.