日期: 2025 年 4 月 29 日
文心大模型又双叒叕进化了!
最新发布的文心大模型X1 Turbo和文心4.5 Turbo性能更优、价格更低,分别在工具调用、行程规划、逻辑推理、写作&问答等多个领域表现出色,并归功于多模态基础模型优化、自反馈增强的后训练框架等核心技术。
SIGIR 2025 |MRAMG-Bench:北大华为云发布“多模态检索增强——多模态生成”数据集
业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
规划、分析和生成:PaperCoder自动从论文生成高质量代码库
PaperCoder 是一个多智能体的 LLM 系统,通过规划、分析和生成三个阶段将机器学习论文转化为可运行的代码库,并在多个会议论文上进行了评估,表现出色且超越现有基线。
终于,它来了!Qwen3深夜发布,再次登顶全球大模型开源王座,再见DeepSeek。
Qwen3今日发布,参数量2350亿的旗舰模型Qwen3-235B-A22B超越多个模型。亮点包括混合思维模式、多语言支持和增强代理能力;预训练数据集涵盖119种语言,计算成本更低;链接见原文。
超越Flux,C站最受欢迎!
HiDream发布后迅速受到全球开源AI绘画爱好者的关注,其量化版本成为C站最受欢迎的真人大模型之一。HiDream是智象未来科技有限公司自主研发的图像生成大模型,具备图像生成和交互编辑功能,并在技术上实现了语义理解、算力优化及多模态融合等创新点。
帕西尼获数亿元融资:比亚迪在具身智能领域最大单笔投资
人形机器人企业帕西尼近日获得比亚迪数亿元战略投资,成为其在具身智能领域最大单笔投资。帕西尼专注于高精度多维触觉传感器的研发与产业化,本轮融资将用于产品研发及量产推进。
王兴兴获聘背后:应用型人才培养改革,高校何为?
上海应用技术大学等5所高校率先启动应用型本科高校人才培养改革试点,邀请企业专家组建专业设置委员会,参与学科优化调整和人才培养模式改革。此举旨在实现人才培养与产业需求无缝对接。
小而强大,阿里开源全球最强开源模型 Qwen3!
Qwen3 是全球最强开源模型。它在代码、数学、通用能力等基准测试中超越了 DeepSeek-R1 等顶级模型,并且仅需4张H20就能实现本地部署,成本仅为DeepSeek-R1的35%。
Qwen3发布!超DeepSeek R1登顶开源榜,还带来了跟R1不同配方
阿里巴巴开源新一代通义千问Qwen3系列模型,包含8款不同尺寸。旗舰模型Qwen3 235B采用混合专家(MoE)架构,在多项测评中超越DeepSeek-R1、OpenAI-o1等主流模型。性能提升体现在推理、指令遵循、工具调用、多语言能力等方面。Qwen3全尺寸发布后,社区反响热烈,参数正在“变小”但保持出色表现。