刚刚,谷歌整了个海豚语言模型!

叫DolphinGemma,还能塞进Pixel手机
直接带着去海里跟海豚聊天!

(海豚:啊对对对,我们聊得可嗨了)
我这一看就来了精神,赶紧点开来看
发现这还真不是愚人节整活儿
谷歌真搞了个400M参数的小模型
专门用来研究海豚是咋叽里呱啦说话的
我靠,这是要做跨物种交流了啊!

评论区已经炸开了锅,有人甚至问到:
啥时候能来个DogGemma?
这是要把把狗语翻译成人话?
RVMON 🎹(@rvm0n_) 激动地嚷嚷:
「这太疯狂了,哈哈哈!但说真的,请做个DogGemma吧。想象一下,未来你真的能理解并和你的狗交谈!」
Yuchen Jin(@Yuchenj_UW) 更是跃跃欲试:
「我迫切需要一个能与狗交流的大语言模型!!」
luffy(@0xluffyb) 反手就是一句灵魂提问:
「我迫切需要一个能与非技术人员交流的大语言模型,拜托了」
(好像跟产品经理交流比跟狗交流更难…

看了下模型细节,还真有点儿东西:
这个海豚版Gemma是挺严肃正经的一项研究
是谷歌跟野生海豚项目(Wild Dolphin Project)
一起搞出来的正经科研活儿
人家收集了好几年海豚声音数据
捣鼓出了这么个能预测海豚下一句话的模型
关键是,这模型还能在Pixel 9上直接跑
想想看,拿着手机就能去海里听懂海豚说啥
这不比你那张嘴喊「哎、喂、嗨、啊、呀、这、那」什么的管用多了?

据说他们给模型喂了从1985年开始收集的
一大堆大西洋斑海豚(Stenella frontalis)
在巴哈马海域录制的声音和视频数据
这帮科学家还把数据标记得明明白白:
是哪只海豚在说话,在干啥,啥社交场景
整的跟海豚版抖音似的,全记下来了

让我更惊讶的是,这模型竟然能找出一些固定组合
比如「海豚妈妈叫娃专用哨声」
还有「打架时的爆发脉冲尖叫」
甚至还有「追求异性或者追鲨鱼时用的点击声」
这下可算知道为啥海豚都说咱听不懂了
人类听个「吱吱吱」,海豚那边已经传输完一段情诗

我寻思这个研究扎实程度比某人天天喊的
「AI已经有意识了」靠谱多了
人家是实打实地收集+训练+测试
而且模型结构也是深思熟虑的:
SoundStream分词器把海豚叫声变成一个个token
然后喂给能处理复杂序列的小模型架构
训练完才400M参数,小号Gemma无疑了

除了分析海豚自然交流,他们还整了个
CHAT系统(海豚听觉增强遥测)
简单说就是一个可以在水下用的电脑
能合成特定的哨声给海豚听
每种哨声代表一种物品,比如海藻、海草或围巾
希望好奇的海豚能模仿这些哨声「点单」

Keith Mansfield(@KeithMansfield) 直接说他多年来一直关注这项研究:
「我多年来一直关注野生海豚项目,并在我的《你真正需要知道的50个AI理念》一书的《巴别塔》章节中写过使用AI与海豚交流/更好地理解海豚的内容。很高兴看到Denise Herzing和Thad Starner出色的工作得到认可。十年后,我们将取得更大进展。如果我们连地球表亲都无法理解,又怎么期望与外星人交流呢?」
看到这里,我不禁想起前阵子满屏都是啥
超级大模型、千亿参数、多模态、使用工具、更高效率、……
一个个又卷又能聊,甚至随时就要毁灭了人类
结果谷歌这边丝滑地搞了个小而美的应用
真枪实弹地研究跨物种交流
这才是有用且有意思啊,这可算得上是另一条路径的AGI 啊!
话说回来,他们这套CHAT系统搞起来挺复杂:
-
得在海洋噪声中准确听到海豚模仿的声音
-
实时识别出海豚模仿的是哪种哨声
-
通过骨传导耳机告诉研究员海豚「要」啥物品
-
让研究员快速响应,给出正确物品强化连接
本来这么复杂的事儿就得用定制硬件
现在倒好,一部Pixel 6手机就能搞定
实时分析海豚声音,今夏上市的Pixel 9
甚至能同时跑深度学习和模板匹配算法
手机直接变海豚翻译器,啥定制设备都省了

说起来,研究人员花这功夫研究海豚语言
可不只是闲得蛋疼
人家几十年如一日地钻研这个问题
就连海豚常用的声音类型都分析清楚了:
特征哨声(signature whistles):相当于名字
爆发脉冲「尖叫」:打架时用的
点击「嗡嗡」声:求偶或追逐鲨鱼时用的
听着是不是有点儿像人类的语言?
我才不相信海豚整天就光「吱吱吱」呢

更让人惊喜的是,谷歌还打算今年夏天
把DolphinGemma作为开源模型放出来
虽然是用大西洋斑海豚声音训练的
但应该对研究其他鲸类物种也有用
比如宽吻海豚或者飞旋海豚
各位科研人员可以拿去对自己的声学数据集
进行挖掘、寻找模式了

看到这里,我想评论区那些想要
与猫狗交流的网友,也不是没希望啊
Eben Bayer(@ebenbayer) 说:
「太棒了!接下来我们再做头足类动物吧!」
Mycosoft(@Mycosoft) 直接说他们在做蘑菇大模型:
「我们正在开发FungiLLM(真菌大语言模型)」

Emily(@IamEmily2050) 更是断定:
「这是一个很好的开始;我相信猫咪模型会非常受欢迎🤣🤣」
看来跨物种交流已经成为AI 界下一个风口
人类听得懂蚂蚁和蜜蜂的聊天内容
还会远吗?

当然,也有网友对这项技术提出了担忧
Celmaun(@Celmaun) 提醒我们:
「很酷。希望在向海豚广播这些声音时考虑道德问题,避免干扰它们的心理健康。」
确实,咱们用AI与海豚交流
要是不小心说了啥不该说的
比如「你今天看起来好胖哦」或者「海里有鲨鱼」
结果影响了人家海豚心理健康
那可就不好了……
不说了,我要去下载模型研究下怎么玩了
毕竟那些手快的人,已经开始赚钱了……

不过话说回来,借助AI跟动物交流
这事儿比啥元宇宙、Web3、搞点钱更吸引我
想想看,万一某天你家狗狗能说话了
「主人,你能不能少刷会儿手机,陪我玩会儿?」
「我不是故意拆家的,是你三天没带我出门了!」
「喂,那个偷偷亲你的不是你初恋吗?」
这下可真是家里藏不住秘密了……
不过「海豚语言研究」这条路还很长
但有野生海豚项目的野外研究、佐治亚理工的工程专业知识
再加上谷歌的强大技术支持
这「跨物种交流」的梦想
或许真的不再是科幻电影的专利了!
(文:AGI Hunt)