SIGIR 2025 |MRAMG-Bench:北大华为云发布“多模态检索增强——多模态生成”数据集
业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
Qwen3 是全球最强开源模型。它在代码、数学、通用能力等基准测试中超越了 DeepSeek-R1 等顶级模型,并且仅需4张H20就能实现本地部署,成本仅为DeepSeek-R1的35%。
今日AI焦点:Anthropic启动模型’福祉’研究引思考,Adobe升级Firefly创意工具,xAI拟融资200亿美元;微软、OpenAI进展动态,Google发布Recall功能和ZAPBench数据集。
MLNLP社区举办学术Talk,邀请香港城市大学潘文博分享大模型安全对齐的研究成果,揭示其内部机制由多个维度控制,主持人王鹏介绍相关背景知识。
中国团队HiDream智象未来开源了图像生成大模型HiDream-I1和交互编辑模型HiDream-E1,实现了对话到图像创作的闭环。HiDream-I1在权威榜单中登顶,并刷新了行业记录。
全球著名开源大模型平台Hugging Face宣布收购Pollen Robotics进军实体机器人领域,此次收购将让约20名Pollen员工加入Hugging Face。
EasyControl_Ghibli是一款免费且易于使用的AI模型,生成吉卜力风格图像。AudioX是统一的扩散Transformer模型,支持多种模态输入和自然语言控制。Serena是一个免费代码助手集成LLM功能。uniOCR是通用Rust OCR引擎,提供本地及云服务。MCP Server for Milvus为LLM应用提供Milvus向量数据库访问桥梁。
Hugging Face创始人Thomas Wolf发布了新工具DeepSite,用户只需描述需求就能快速生成网页和游戏。该工具使用最新的DeepSeek V3模型,界面直观易用,完全免费。