谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群
GoodNav 9 月 27 日报道,根据谷歌的新闻稿,谷歌公司正在不断投入资源开发一种用于识别鲸鱼声音的 AI 模型。该模型最新版本能够识别 8 种鲸鱼的叫声,并进一步区分其中两种鲸鱼的不同发声类型。
谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“难以观察”的鲸群行为模式。目前,该模型已向学术人员开放下载,地址为(点击访问)。
据了解,自 2018 年以来,谷歌公司便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,开展鲸鱼叫声分类的研究。最初,他们为座头鲸开发了检测模型,成功识别了座头鲸的鸣叫声,从而获得了相关鲸群在特定时间和地点的鸣叫规律,并发现了新的鲸群栖息地。
谷歌还与加拿大渔业及海洋部(DFO)和 Rainforest Connection 合作,针对濒临灭绝的南方定居型虎鲸开发了一系列检测模型,并将其应用于水下麦克风监测网络,能够实时向 DFO 和相关单位报告虎鲸的位置。
谷歌公司提到,目前其鲸鱼声音识别模型可以识别座头鲸、虎鲸、蓝鲸、长须鲸、小须鲸、布氏鲸、北大西洋露脊鲸和北太平洋露脊鲸。考虑到鲸鱼声音覆盖的频率范围极广(例如蓝鲸的发声为 10 Hz 低频,而齿鲸的发声为 120 kHz 高频),因此该模型在科研领域具有重要意义。
在开发这款鲸鱼声音识别模型时,研究人员首先将原始音频转换为时频谱(Spectrogram),作为模型识别声音的基础,每个时间窗包含 5 秒钟的声音片段。接着,模型利用梅尔刻度法调整这些时频谱的声音频率,并通过压缩和正则化突出声音特征,从而将其分类为不同鲸鱼的鸣叫类别。
由于海洋中存在各种声音,研究人员还加入了大量背景声音来训练模型,以确保能够准确识别鲸鱼声音并排除噪音。实验结果表明,该鲸鱼声音识别模型能够有效地区分不同种类的鲸鱼,尤其是小须鲸和布氏鲸的声音。