月度归档: 2025 年 4 月
Agent 要被吃进大模型了
MLNLP社区介绍国内外知名机器学习与自然语言处理社区,致力于促进学术界、产业界和爱好者的交流合作。最新发布的o系列模型性能提升且价格更低,支持调用ChatGPT工具;OpenAI新推出的Codex CLI本地代码智能体展示了多模态编程能力。
又一个世界顶级国产AI绘画大模型:HiDream
中国团队HiDream智象未来开源了图像生成大模型HiDream-I1和交互编辑模型HiDream-E1,实现了对话到图像创作的闭环。HiDream-I1在权威榜单中登顶,并刷新了行业记录。
openai开源文本转语音框架OpenAI.fm,谷歌清晨发布Gemini 2.5 Flash preview,
OpenAI.fm、Python A2A、LLManager、Together Open Deep Research、Gemini Coding Agent 和 Gemini 2.5 Flash 等创新项目介绍。
一周狂揽1.3k星!火爆全网能控制安卓机器的 Agent 开源了,什么 RPA 、什么小红书,统统拿下!
DroidRun 是一个通过 LLM 控制 Android 设备的强大框架。它支持多种 API 密钥提供商,并提供简单易用的 Python API 和命令行界面,可用于自动化任务和测试。
硅谷聚会|和明星公司CEO们讨论“AI+传统行业”的实操与机遇
4月25日晚6点,阿里云北美资深架构师联合硅谷明星公司CEO们讨论AI与传统行业的结合,分享干货和经验。活动地点在Menlo Park,涵盖地产、金融等多行业。
谷歌大模型“性价比之王”来了!混合推理模型,思考深度可自由控制,竞技场排名仅次于自家Pro
谷歌新推出Gemini 2.5 Flash预览版,性价比高且支持自由调控思考深度。在大模型竞技场中排名第二,并在编程和数据分析能力上超过o4-mini。
谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini
谷歌发布首个混合推理模型Gemini 2.5 Flash,引入了革命性”思考预算”功能,性能显著提升,在多个基准测试中表现优异。