Action EADM (2016-2019)
Environmental Acoustic Data Mining
Responsables
- Hervé GLOTIN, LSIS, INS2i
- Marc ASCH, LAFMA, INSMI
Passage à l’échelle ; Apprentissage non supervisé de représentation des données sonores ; Extraction de nouvelles connaissances ; Exploration des écosystèmes peu connus (forêt primaire, abysses, zones reculées) ; Indice automatique de biodiversité
Acoustique infrasonique, audible et ultrasonique, 5Hz à 500 kHz, 16 à 32 bits, 1 à 64 senseurs, en continu flux en ligne ou en HDD To. En général les corpus vont du Go à quelques To sur une zone pour des périodes d’une semaine à des années. Métadonnées géographiques, climatiques et phylogénétiques
La bioacoustique nécessite le croisement de disciplines et méthodes d’indexation et de modélisation HPC. A cette fin, cet atelier propose de développer une infrastructure complète de gestion de masse de données bioacoustiques : stockage, traitement, représentation collaborative et manipulation efficace, visualisation et synthèse automatique. En exemple de produits informatifs à forte valeur ajoutée : produire des indices écologiques liés à une espèce sensible au réchauffement climatique, ou analyser la qualité d’un écosystème par transcription de l’acoustique en indices sémantiques de haut niveau. Ces défis technologiques et écologiques imposent une innovation théorique en modélisation et analyse stochastique de données et le développement de systèmes efficients pour les sciences environnementales. Il n’existe pas à ce jour de solution algorithmique complète capable de traiter efficacement, en temps et en espace, l’explosion de ces données bioacoustiques. Pour cela EADM fédère des experts en masses de données, informatique fondamentale, traitement statistique du signal, classification automatique, bioacoustique et écologie.
L’observation et l’étude la biodiversité sont des enjeux majeurs de notre siècle, tant pour comprendre notre environnement, et son évolution, que sa vulnérabilité face aux activités humaines. La bioacoustique, discipline émergente à l’interface de l’informatique, le traitement des signaux et l’écologie, analyse la trace acoustique directe (cri, chant, biosonar, etc) ou indirecte (leur déplacement ou modification du milieu) d’une majorité d’espèces animales. Les capteurs acoustiques, microphones et hydrophones, offrent à bas coût un échantillonnage à haute fréquence temporelle et spatiale. Les domaines d’applications et les sites de mesures croissent donc de façon exponentielle imposant un passage à l’échelle de la bioacoustique. Ainsi, plusieurs To sont produits en quelques jours d’acquisition multi-capteurs par site. Ce volume est à démultiplier sur M mois pour les analyses comparées entre N écosystèmes remarquables de la planète.
La bioacoustique nécessite le croisement de disciplines et méthodes d’indexation et de modélisation HPC. A cette fin, l’Action EADM propose de développer une infrastructure complète de gestion de masse de données bioacoustiques : stockage, traitement, représentation collaborative et manipulation efficace, visualisation et synthèse automatique.
En exemple de produits informatifs à forte valeur ajoutée : produire des indices écologiques liés à une espèce sensible au réchauffement climatique, ou analyser la qualité d’un écosystème par transcription de l’acoustique en indices sémantiques de haut niveau. Ces défis technologiques et écologiques imposent une innovation théorique en modélisation et analyse stochastique de données et le développement de systèmes efficients pour les sciences environnementales. Il n’existe pas à ce jour de solution algorithmique complète capable de traiter efficacement, en temps et en espace, l’explosion de ces données bioacoustiques. Pour cela SDAE fédère des experts en masses de données, informatique fondamentale, traitement statistique du signal, classification automatique, bioacoustique et écologie.
L’ère du traitement automatique de séquences acoustiques s’est ouverte vers 1970, dès les applications pionnières en reconnaissance automatique de la parole. Depuis vingt ans l’automatisation des séquences acoustiques s’est étendue au traitement bioacoustique. Depuis cinq ans une nouvelle révolution se produit avec la miniaturisation et la portabilité des capteurs (dont téléphonie mobile), et la puissance de calcul et de stockage de masse. Il y a 30 ans les acquisitions étaient monophoniques sur 8 bits à 16 kHz. Elles sont de nos jours réalisées sur 24 bits à 192 kHz par des antennes multi-capteurs, cependant leurs traitements embarqués doivent rester temps-réels. Ainsi, plusieurs installations dans le monde enregistrent en continu des To de flux acoustiques dérivés pour l’analyse de la biodiversité : ANTARES (Toulon), NEMO (Sicile), Neptune (nord USA). Des programmes de science participative s’installent rapidement, d’autres sont conduits par l’industrie offshore (impacts canon acoustique, bruit d’éolienne), ou la défense (effet sonar). La problématique n’est plus l’acquisition de données, mais leur analyse, classification, regroupement par traitement signal et stochastique à l’échelle. Par ailleurs, il n’existe pas d’archives centralisées, une grande interrogation demeure donc actuellement sur la conservation et l’accès pérenne de ces masses de données scientifiques.