Hugging Face
DeepSeek Prover-V2,这才是探索AGI 的正确姿势!
DeepSeek 推出新模型 DeepSeek-Prover-V2-671B,专为数学定理证明打造。该模型参数量大(671亿),架构使用MoE技术,隐藏维度高达7168,支持超长上下文窗口(约80万汉字)。通过Lean 4生态训练,并结合生成自然语言讲解与强化学习提升性能。
SIGIR 2025 |MRAMG-Bench:北大华为云发布“多模态检索增强——多模态生成”数据集
业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
小而强大,阿里开源全球最强开源模型 Qwen3!
Qwen3 是全球最强开源模型。它在代码、数学、通用能力等基准测试中超越了 DeepSeek-R1 等顶级模型,并且仅需4张H20就能实现本地部署,成本仅为DeepSeek-R1的35%。
2025-04-26 | AI每日速报
今日AI焦点:Anthropic启动模型’福祉’研究引思考,Adobe升级Firefly创意工具,xAI拟融资200亿美元;微软、OpenAI进展动态,Google发布Recall功能和ZAPBench数据集。
潘文博@香港城市大学:揭示大模型安全对齐的隐藏维度:从多维特征空间看对齐机制与脆弱性
MLNLP社区举办学术Talk,邀请香港城市大学潘文博分享大模型安全对齐的研究成果,揭示其内部机制由多个维度控制,主持人王鹏介绍相关背景知识。
又一个世界顶级国产AI绘画大模型:HiDream
中国团队HiDream智象未来开源了图像生成大模型HiDream-I1和交互编辑模型HiDream-E1,实现了对话到图像创作的闭环。HiDream-I1在权威榜单中登顶,并刷新了行业记录。
Hugging Face收购 Pollen,进军实体机器人
全球著名开源大模型平台Hugging Face宣布收购Pollen Robotics进军实体机器人领域,此次收购将让约20名Pollen员工加入Hugging Face。