字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA
字节推出视觉-语言多模态大模型Seed1.5-VL,具备更强的通用多模态理解和推理能力,在视频理解、视觉推理等方面表现突出。
字节推出视觉-语言多模态大模型Seed1.5-VL,具备更强的通用多模态理解和推理能力,在视频理解、视觉推理等方面表现突出。
本文介绍了一种名为 DanceGRPO 的强化学习框架,在视觉生成任务中实现了统一优化。该方法通过 GRPO 策略在 Diffusion 和 Rectified Flow 模型上进行了测试,并覆盖了文本到图像、视频等多种任务,展示了其在不同基础模型上的有效性及对多种奖励模型的适应性。
本文介绍了国内CVC在人工智能领域的投资情况,主要分为互联网平台企业、AI企业及其他行业的头部公司三大类。腾讯、百度等传统巨头长期坚定投资AI,而京东、字节跳动等中途“下车”。智谱AI旗下的星连资本成为后来者居上代表,投资总量迅速增至28起。腾讯在AI领域的投资数量近年来有所减少,而百度则积极扩展至A轮投资。
OpenAI 首席执行官 Sam Altman 拟定于 2030 年将人类变成跨星球物种,他近期聘请 Instacart CEO Fidji Simo 监管 OpenAI 的应用部,此举或为公司上市铺路。
研究团队在Reddit的r/changemyview(CMV)版块进行了一场未经授权的实验,使用多个AI账号伪装成人类用户参与讨论。结果显示,这些AI机器人发表的评论能够说服社区用户改变观点,并且其成功率是人类基线水平的3-6倍。
最近推出OpenMemory MCP旨在解决跨AI工具记忆共享问题,提供私有、持久化的记忆层,支持多种MCP兼容客户端,并强调隐私和本地控制。