IT之家 12 月 27 日消息,據(jù) Munich Eye 當?shù)貢r間 22 日報道,2025 年,人工智能(AI)和機器學習領域的突破有望推動我們理解動物交流的進程,解開動物發(fā)聲背后的長期謎題。近期,設立的 Coller-Dolittle 獎項為解碼動物聲音的研究提供了可觀獎金,體現(xiàn)了科學界對此的樂觀情緒。
目前已有多個研究項目正致力于開發(fā)能夠解讀動物聲音的算法。其中,Ceti 計劃一直在破解抹香鯨特有的點擊聲和座頭鯨的歌聲。現(xiàn)代的機器學習方法依賴大量的數(shù)據(jù)集,但高質(zhì)量的動物聲音數(shù)據(jù)一直難以獲得,限制了研究進展。
譬如,包括 ChatGPT 在內(nèi)的大型語言模型就使用了來自互聯(lián)網(wǎng)的大量文本數(shù)據(jù)進行訓練,而與之形成鮮明對比的是,動物交流研究可用的數(shù)據(jù)集仍然有限。雖然 LLMs 的訓練數(shù)據(jù)量超過 500GB 的文本信息,但 Ceti 計劃在研究抹香鯨的聲音時,僅獲得了不到 8000 個錄音樣本。這一差距也凸顯了研究人員在理解動物交流方面的難題。
此外,人類語言的解釋依賴于共同的語法和語義規(guī)則,而解讀動物的叫聲卻充滿了不確定性 區(qū)分狼的不同嚎叫所代表的意義,仍然是一個巨大的挑戰(zhàn)。
一旦這些龐大的數(shù)據(jù)集完成收集,深度神經(jīng)網(wǎng)絡等先進的分析技術將能夠揭示動物聲音背后的規(guī)律和結構,或許能發(fā)現(xiàn)一些與人類語言類似的模式。
盡管研究取得了很大進展,關于解碼動物聲音的最終目標仍然是一個亟待解答的問題。據(jù)IT之家了解,像 Interspecies.io 這樣的組織,明確表示希望將跨物種的交流轉(zhuǎn)化為人類能夠理解的信號,甚至提出要將動物的叫聲翻譯成人類語言。不過,科學界普遍認為,非人類動物并不具備類似人類語言那樣的結構化語言。