谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命

AIGC动态2天前发布 AIera
69 0 0
谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命

 

文章摘要


【关 键 词】 海豚AI跨物种语言模型

谷歌最新推出的DolphinGemma大模型,基于30年的海豚研究数据,试图破解海豚的语言密码。这一仅有400M参数的轻量级模型能够在普通Pixel手机上运行,不仅能够识别海豚的声音模式,还能预测它们的下一个发声,类似于大型语言模型(LLM)预测下一个词的方式。DolphinGemma的推出标志着跨物种交流迈出了重要一步,它不仅是第一个能与动物交流的LLM,还展示了AI在非文本领域的潜力。

DolphinGemma利用了Google特有的音频技术SoundStream分词器,高效地表示海豚声音,并通过适合复杂序列的模型架构进行处理。该模型基于Gemma构建,Gemma是Google的轻量级、最先进的开源模型,采用与Gemini模型相同的研发和技术。与文本LLM不同,DolphinGemma是一个音频输入、音频输出的模型,能够处理自然海豚声音序列,识别模式、结构,并预测序列中可能的后续声音。

海豚数据集来源于WDP(Wild Dolphin Project)数十年的坚持。自1985年以来,WDP开展了世界上持续时间最长的水下海豚研究项目,对巴哈马特定社区的野生大西洋斑点海豚进行了跨代研究。这种非侵入性的研究方法产生了丰富而独特的数据集,包括数十年水下视频和音频,与个体海豚身份、生活史和观察行为仔细配对的数据。这些数据为AI分析提供了必不可少的上下文,帮助研究人员理解海豚声音序列中的结构和潜在含义。

为了让DolphinGemma的声音被海豚听到,WDP与佐治亚理工学院合作开发了“鲸目动物听力增强遥测”(CHAT)系统,一种水下计算机。CHAT系统不是直接破译海豚的复杂自然语言,而是建立一个更简单、共享的词汇表。通过在人类之间演示系统,研究人员希望天生好奇的海豚会学会模仿这些哨声来请求她们喜欢的特定物体。CHAT的新一代系统将以Google Pixel 9为基础,整合扬声器/麦克风功能,并利用手机的先进处理能力,减少了对自定义硬件的需求,极大方便了在公海进行研究的科研人员。

DolphinGemma的推出不仅展示了AI在跨物种交流中的潜力,也为类似WDP这样数十年如一日坚持科研的团队带来了更多机会。DeepMind的CEO Hassabis透露,未来计划与更多的高智商动物进行交流,如狗和猫。这一技术的进一步发展,可能会让每个人都能借助AI直接与宠物进行交流,开启人与动物沟通的新篇章。

原文和模型


【原文链接】 阅读原文 [ 1440字 | 6分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek-v3
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...