机器学习协助发现抹香鲸的“字母表”

麻省理工学院计算机科学与人工智能实验室和CETI项目的研究人员相信,他们借助机器学习技术解锁了一种抹香鲸的“字母表”。该研究的结果发表在题为“抹香鲸嗓音中的情境和组合结构”下的论文中,指出了我们对鲸类通讯理解的关键突破。

这项研究涉及到了编码——一系列用于不同语言功能的点击声。CSAIL主任达尼埃拉·鲁斯告诉TechCrunch:“我们发现了编码结构中的先前未描述的变化。我们发现编码类型并非任意,而是形成了一个新发现的组合编码系统。”

尽管鲸类的发声一直是研究的关键对象,但这项新研究的团队表示他们发现了喋喋不休的海洋哺乳动物中以前未知的微妙之处。论文指出,先前的研究已经记录了150种不同的抹香鲸编码。

“其中的一部分已被证明能编码关于呼叫者和氏族身份的信息,”它解释道。“然而,几乎关于抹香鲸通讯系统的所有其他内容,包括关于其结构和信息传递能力的基本问题,仍然不为人所知。”

团队借鉴了在去年六月去世的先锋海洋生物学家罗杰·佩恩的研究成果。佩恩最具影响力的工作涉及座头鲸的歌曲。“他真的激励我们使用最先进的技术来更深入地了解鲸类,”鲁斯说。

团队使用了机器学习解决方案来分析研究人员沙恩·杰罗在加勒比海东部小岛多米尼加海岸收集到的8719个抹香鲸编码的数据集。

“我们会得到输入,然后调整我们的机器学习,以更好地可视化和理解,”鲁斯解释道。“然后我们会与生物学家一起分析输出。”

团队的方法与旧有的分析形成了变化,以前的分析研究了单个编码。当声音被研究为鲸鱼之间的交流,即情境化细节时,会呈现出更丰富的画面。情境细节使用音乐术语进行分类,包括节奏、节拍、装饰和自由节奏。然后,团队分离出了其称为抹香鲸语音字母表的内容。

“这个语音字母表使我们能够系统地解释编码结构中观察到的变化,”鲁斯说。“我们认为,这可能是人类语言之外的第一个例子,其中一个通讯提供了一个关于模式双重性的语言概念。这指的是一组单独没有意义的元素,可以组合成更大的有意义单位,有点像将音节组合成单词。”

这些“单词”的含义根据不同的情境而有所不同。论文补充说:

我们的结果表明,抹香鲸的声音形成了一个复杂的组合式通讯系统:看似任意的编码类型可以通过节奏、节拍、自由节奏和装饰特征的组合来解释。在自然界中,像这样大规模的组合语音系统极为罕见;然而,抹香鲸对其使用表明这并非人类独有,而是可以源自截然不同的生理、生态和社会压力。

尽管这一突破对所有参与者来说都令人兴奋,但仍有许多工作要做,首先是针对抹香鲸,然后可能扩展到其他物种,如座头鲸。

“我们决定研究抹香鲸,因为我们有大量的数据集,并且有可能收集更多的数据集,”鲁斯说。“此外,因为这种点击形成了一种离散的通讯系统,所以比连续的通讯系统更容易分析。但即使是罗杰·佩恩的工作也表明,座头鲸的歌不是随机的。有一些部分会重复出现,其中存在着有趣的结构。我们只是还没有深入研究而已。”