重磅!谷歌新AI成功预测海豚语言!跨物种沟通新时代,要来了!

刚刚,谷歌整了个海豚语言模型!

DolphinGemma,还能塞进Pixel手机

直接带着去海里跟海豚聊天!

(海豚:啊对对对,我们聊得可嗨了)

我这一看就来了精神,赶紧点开来看

发现这还真不是愚人节整活儿

谷歌真搞了个400M参数的小模型

专门用来研究海豚是咋叽里呱啦说话的

我靠,这是要做跨物种交流了啊!

评论区已经炸开了锅,有人甚至问到:

啥时候能来个DogGemma?

这是要把把狗语翻译成人话?

RVMON 🎹(@rvm0n_) 激动地嚷嚷:

「这太疯狂了,哈哈哈!但说真的,请做个DogGemma吧。想象一下,未来你真的能理解并和你的狗交谈!」

Yuchen Jin(@Yuchenj_UW) 更是跃跃欲试:

「我迫切需要一个能与狗交流的大语言模型!!」

luffy(@0xluffyb) 反手就是一句灵魂提问:

「我迫切需要一个能与非技术人员交流的大语言模型,拜托了」

(好像跟产品经理交流比跟狗交流更难…

看了下模型细节,还真有点儿东西:

这个海豚版Gemma是挺严肃正经的一项研究

是谷歌跟野生海豚项目(Wild Dolphin Project)

一起搞出来的正经科研活儿

人家收集了好几年海豚声音数据

捣鼓出了这么个能预测海豚下一句话的模型

关键是,这模型还能在Pixel 9上直接跑

想想看,拿着手机就能去海里听懂海豚说啥

这不比你那张嘴喊「哎、喂、嗨、啊、呀、这、那」什么的管用多了?

据说他们给模型喂了从1985年开始收集的

一大堆大西洋斑海豚(Stenella frontalis)

在巴哈马海域录制的声音和视频数据

这帮科学家还把数据标记得明明白白:

是哪只海豚在说话,在干啥,啥社交场景

整的跟海豚版抖音似的,全记下来了

让我更惊讶的是,这模型竟然能找出一些固定组合

比如「海豚妈妈叫娃专用哨声

还有「打架时的爆发脉冲尖叫

甚至还有「追求异性或者追鲨鱼时用的点击声

这下可算知道为啥海豚都说咱听不懂了

人类听个「吱吱吱」,海豚那边已经传输完一段情诗

我寻思这个研究扎实程度比某人天天喊的

「AI已经有意识了」靠谱多了

人家是实打实地收集+训练+测试

而且模型结构也是深思熟虑的:

SoundStream分词器把海豚叫声变成一个个token

然后喂给能处理复杂序列的小模型架构

训练完才400M参数,小号Gemma无疑了

除了分析海豚自然交流,他们还整了个

CHAT系统(海豚听觉增强遥测)

简单说就是一个可以在水下用的电脑

能合成特定的哨声给海豚听

每种哨声代表一种物品,比如海藻、海草或围巾

希望好奇的海豚能模仿这些哨声「点单」

Keith Mansfield(@KeithMansfield) 直接说他多年来一直关注这项研究:

「我多年来一直关注野生海豚项目,并在我的《你真正需要知道的50个AI理念》一书的《巴别塔》章节中写过使用AI与海豚交流/更好地理解海豚的内容。很高兴看到Denise Herzing和Thad Starner出色的工作得到认可。十年后,我们将取得更大进展。如果我们连地球表亲都无法理解,又怎么期望与外星人交流呢?」

看到这里,我不禁想起前阵子满屏都是啥

超级大模型千亿参数多模态、使用工具、更高效率、……

一个个又卷又能聊,甚至随时就要毁灭了人类

结果谷歌这边丝滑地搞了个小而美的应用

真枪实弹地研究跨物种交流

这才是有用且有意思啊,这可算得上是另一条路径的AGI 啊!

话说回来,他们这套CHAT系统搞起来挺复杂:

  1. 得在海洋噪声中准确听到海豚模仿的声音

  2. 实时识别出海豚模仿的是哪种哨声

  3. 通过骨传导耳机告诉研究员海豚「要」啥物品

  4. 让研究员快速响应,给出正确物品强化连接

本来这么复杂的事儿就得用定制硬件

现在倒好,一部Pixel 6手机就能搞定

实时分析海豚声音,今夏上市的Pixel 9

甚至能同时跑深度学习和模板匹配算法

手机直接变海豚翻译器,啥定制设备都省了

说起来,研究人员花这功夫研究海豚语言

可不只是闲得蛋疼

人家几十年如一日地钻研这个问题

就连海豚常用的声音类型都分析清楚了:

特征哨声(signature whistles):相当于名字

爆发脉冲「尖叫」:打架时用的

点击「嗡嗡」声:求偶或追逐鲨鱼时用的

听着是不是有点儿像人类的语言?

我才不相信海豚整天就光「吱吱吱」呢

更让人惊喜的是,谷歌还打算今年夏天

DolphinGemma作为开源模型放出来

虽然是用大西洋斑海豚声音训练的

但应该对研究其他鲸类物种也有用

比如宽吻海豚或者飞旋海豚

各位科研人员可以拿去对自己的声学数据集

进行挖掘、寻找模式了

看到这里,我想评论区那些想要

与猫狗交流的网友,也不是没希望啊

Eben Bayer(@ebenbayer) 说:

「太棒了!接下来我们再做头足类动物吧!」

Mycosoft(@Mycosoft) 直接说他们在做蘑菇大模型:

「我们正在开发FungiLLM(真菌大语言模型)」

Emily(@IamEmily2050) 更是断定:

「这是一个很好的开始;我相信猫咪模型会非常受欢迎🤣🤣」

看来跨物种交流已经成为AI 界下一个风口

人类听得懂蚂蚁和蜜蜂的聊天内容

还会远吗?

当然,也有网友对这项技术提出了担忧

Celmaun(@Celmaun) 提醒我们:

「很酷。希望在向海豚广播这些声音时考虑道德问题,避免干扰它们的心理健康。」

确实,咱们用AI与海豚交流

要是不小心说了啥不该说的

比如「你今天看起来好胖哦」或者「海里有鲨鱼

结果影响了人家海豚心理健康

那可就不好了……

不说了,我要去下载模型研究下怎么玩了

毕竟那些手快的人,已经开始赚钱了……

不过话说回来,借助AI跟动物交流

这事儿比啥元宇宙、Web3、搞点钱更吸引我

想想看,万一某天你家狗狗能说话了

「主人,你能不能少刷会儿手机,陪我玩会儿?」

「我不是故意拆家的,是你三天没带我出门了!」

「喂,那个偷偷亲你的不是你初恋吗?」

这下可真是家里藏不住秘密了……

不过「海豚语言研究」这条路还很长

但有野生海豚项目的野外研究、佐治亚理工的工程专业知识

再加上谷歌的强大技术支持

这「跨物种交流」的梦想

或许真的不再是科幻电影的专利了!

(文:AGI Hunt)

发表评论