大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘,没日没夜加班胖了30斤

Yi Tay宣布重返谷歌DeepMind担任高级研究员,他在谷歌大脑工作3.3年,参与多个人工智能项目。虽然创业经历让他学到了不少知识与经验,但也遭遇了资金紧张和身心健康受损等问题。现决定回归研究根基,继续探索大模型相关方向。

Token化一切!北大、谷歌等提出TokenFormer,Transformer从未这么灵活过

TokenFormer 是一种新的网络结构,通过在注意力机制中引入参数化键值对,实现了模型的灵活扩展和性能提升。它展示了在语言建模和视觉建模上的卓越能力,并提出了专家混合、参数高效微调、端云协同和增强可解释性等未来研究方向。

打破LLM数据孤岛!Anthropic革命性MCP让大模型解锁全网数据,AGI要来了?

Anthropic推出的Model Context Protocol(MCP)允许AI模型原生接入第三方数据源,削弱了应用集成护城河。该协议简化了创建具有MCP能力的服务器和客户端的过程,并展示了如何将Claude与本地SQLite数据库、搜索引擎及YouTube字幕连接起来。

创业一年半,胖了30斤,AI大佬感叹:还是回谷歌好

Yi Tay 是一名从谷歌离职的 AI 科学家,他在文章中分享了自己参与创办 Reka 并担任首席科学家的经历以及创业过程中的艰辛。他提到创业给他带来的健康方面的影响,并在回到谷歌从事研究工作的决定上也表示了对文化问题的看法。