刚刚!UCLA杨林团队证明:仅凭提示词,Gemini 2.5 Pro就可以拿到IMO2025金牌
最新研究表明谷歌Gemini 2.5 Pro模型通过改进提示词和建立解题者-验证者流水线机制,在6道IMO2025题目中成功解答了5道,论文详细阐述了其方法和技术。
最新研究表明谷歌Gemini 2.5 Pro模型通过改进提示词和建立解题者-验证者流水线机制,在6道IMO2025题目中成功解答了5道,论文详细阐述了其方法和技术。
NVIDIA发布OpenReasoning-Nemotron系列推理大模型,涵盖多种规模的数学、科学与代码领域模型,性能领先且支持多代理生成和GenSelect方案优化解题准确性。
Claude Agent介绍了一种智能Agent系统,支持灵活多样的工作流,与Obsidian完美结合,推荐Max订阅计划和相关工具以提升工作效率。
ArchScale是微软推出的一个神经架构预训练工具,支持多种前沿模型及扩展比例定律,提供优化器、高性能训练和全面评估方案等,适合专业研究和实验。
字节开源多语言翻译模型Seed-X,7B参数量,性能媲美甚至超越Gemini-2.5、Claude-3.5、GPT-4,在互联网等多领域表现优秀,支持28种语言。
京东团队开源了JoyAgent-JDGenie,一个端到端的多智能体系统,支持报告生成、代码解释、PPT制作和文件管理等任务。该系统准确率达到75.15%,包含多层次和多模式设计,并提供多种输出格式支持。
清华大学与生数科技合作研发的FreeAudio系统突破10秒时长限制,实现精准时间控制和长时音频生成,3大核心技术包括LLM规划、解耦与聚合注意力控制及上下文潜变量合成等。该系统在多项指标上得分最优,在主观评估中质量最高。未来或将在Vidu产品端上线,并计划进一步探索更长时间段的音频生成技术。