日期: 2025 年 4 月 30 日
ACI为AI智能体提供600+工具的统一访问,与iOS模拟器交互的mcp,播客TTS模型
本文介绍了五个开源项目:ACI(为AI智能体提供600+工具的统一访问)、iOS Simulator MCP Server(用于与iOS模拟器交互的MCP服务器)、Muyan-TTS(高质量零样本语音合成和说话人适配模型)、GraphGen(基于知识图谱生成合成数据以优化大型语言模型)以及Deepwiki MCP Server(通过MCP协议抓取和转换Deepwiki页面为Markdown格式)。
最新!Qwen 3 GPQA跑分接近DeepSeek R1:仅用三分之一参数
大模型独立分析公司Artificial Analysis对Qwen3进行了最新评估,结果显示其表现优异。特别是235B-A22B版本的Qwen3模型,在开启推理模式下达到了70%的GPQA Diamond得分,接近DeepSeek R1和Gemini 2.5 Flash的表现,相比阿里此前最好的Qwen1.5-32B模型有显著提升。
探索LLM如何捕捉和表征领域特定知识
本文揭示了大型语言模型在预填充阶段的隐藏状态中内在地编码了领域特定知识,并提出了一种利用这些轨迹进行查询路由的模型选择策略,显著提高了性能特别是开放式生成任务的表现。
一份关于Gemini预训练的精彩PPT
DeepMind专家Vlad Feinberg在普林斯顿的演讲中讨论了模型规模扩展法则的历史、优化策略及未来研究方向,强调小模型客户需求、推理感知扩展法则,并建议开发硬件专用内核和改进量化技术。