看图猜位置不输o3!字节发布Seed1.5-VL多模态推理模型,在60个主流基准测试中拿下38项第一
字节发布轻量级多模态推理模型Seed1.5-VL,在60个主流基准测试中拿下38项第一,仅用532M视觉编码器+200亿活跃参数即能与大型顶尖模型抗衡。该模型通过多层次架构和训练细节实现了高效处理多种多模态数据的能力。
字节发布轻量级多模态推理模型Seed1.5-VL,在60个主流基准测试中拿下38项第一,仅用532M视觉编码器+200亿活跃参数即能与大型顶尖模型抗衡。该模型通过多层次架构和训练细节实现了高效处理多种多模态数据的能力。
紫东太初和中国科学院国家天文台联合开发的FLARE模型能够精准预测恒星耀发事件,展示了AI在天文学领域的巨大潜力。该模型利用恒星物理属性及历史耀发记录,提高了耀发预测的准确性。
港中文MMLab团队发布首个基于强化学习的推理增强文生图模型T2I-R1,通过双层级CoT推理框架和BiCoT-GRPO强化学习方法实现了高效的图像生成。该模型在多个基准测试中表现出色,并展示了其在理解与生成任务中的有效性。
AI搜索引擎公司Perplexity即将完成一轮5亿美元融资,估值近140亿美元。该公司计划开发新的AI浏览器以与Chrome竞争,并且已经获得了知名风投机构Accel的支持。
Google DeepMind的研究科学家Neel Nanda发布了一篇关于如何写好机器学习论文的指南,旨在帮助研究者将研究成果转化为高质量、科学诚信的论文。该指南强调了构建叙事的重要性,并提供了关键要素和写作流程建议。
Epoch AI指出,若推理模型保持每3-5个月以10倍速度增长,则训练所需的算力可能大幅收敛。当前最前沿的推理模型如o1和o3的推理训练规模还未见顶,但有可能在一到两年内达到上限。
一夜之间泄露的Claude系统提示词包含16739个字,详细定义了模型行为、工具使用和引用格式。新范式通过模拟人类学习过程为LLM提供“记忆”功能,使其具备自主反思用户问题的能力。
Manus智能体开放注册并提供不同会员服务。用户每天至少可免费玩一次,最高每月19900积分可用。同时介绍了另一项新协议AG-UI,旨在标准化AI Agent和前端应用的连接方式。
用AI无限扩展《我的世界》,用户通过鼠标键盘即可自由探索、创作高质量虚拟内容,支持8大Minecraft场景生成。Matrix-Game模型在视觉质量、控制能力等方面超越现有开源基线。