分享
AI每日速报 | 2025-04-29
今日头条:阿里巴巴发布Qwen3系列模型;OpenAI在ChatGPT中增加购物功能。新品动态:腾讯混元3D二代、Character.AI AvatarFX登场;DeepSeek将发布新一代模型。研究发现:GPT-4o可能存在“讨好型”回应;Pony.ai自动驾驶系统成本大降70%。行业观察:微软暂停数据中心建设计划,IBM未来五年计划投资1500亿美元研发。
文心大模型又双叒叕进化了!
最新发布的文心大模型X1 Turbo和文心4.5 Turbo性能更优、价格更低,分别在工具调用、行程规划、逻辑推理、写作&问答等多个领域表现出色,并归功于多模态基础模型优化、自反馈增强的后训练框架等核心技术。
规划、分析和生成:PaperCoder自动从论文生成高质量代码库
PaperCoder 是一个多智能体的 LLM 系统,通过规划、分析和生成三个阶段将机器学习论文转化为可运行的代码库,并在多个会议论文上进行了评估,表现出色且超越现有基线。
超越Flux,C站最受欢迎!
HiDream发布后迅速受到全球开源AI绘画爱好者的关注,其量化版本成为C站最受欢迎的真人大模型之一。HiDream是智象未来科技有限公司自主研发的图像生成大模型,具备图像生成和交互编辑功能,并在技术上实现了语义理解、算力优化及多模态融合等创新点。
小而强大,阿里开源全球最强开源模型 Qwen3!
Qwen3 是全球最强开源模型。它在代码、数学、通用能力等基准测试中超越了 DeepSeek-R1 等顶级模型,并且仅需4张H20就能实现本地部署,成本仅为DeepSeek-R1的35%。
DeepSeek R2 参数被“意外”泄漏
DeepSeek R2参数量高达1.2万亿,采用Hybrid MoE 3.0架构,在保持模型能力的同时实现了计算资源的极致压缩,并引入了专门针对法律文书分析的新模块。其多模态精度达到92.4%,误报率低,部署优势明显,支持国产芯片优化,预计未来将减少对西方依赖。