日期: 2025 年 7 月 5 日
一站式多模态研究与播客生成工具
这是一个简单的科研和播客生成项目,使用LangGraph与谷歌Gemini 2.5模型系列结合三个实用功能。用户可以输入科研主题并提供YouTube视频URL,系统会搜索研究主题、分析视频,并生成带有引用的报告及短播客。
ICML 2025 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成
上海交通大学联合团队提出MAS-GPT,通过生成式设计范式简化多智能体系统构建,只需一句Query就能生成一套可执行的MAS。MAS-GPT已在多个基准任务上超越现有方法,展示了高效和泛化能力。
刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信
刚泄露的Grok 4和Grok 4 Code基准测试结果显示其在Humanities Last Exam(HLE)上达到惊人的45%,远超OpenAI o3及Claude Opus 4。此外,在研究生级物理和天文学问题上得分高达87-88%。
九原客推荐的一些关于DeepResearch 的学习资源
九原客推荐的DeepResearch学习资源包括综述、评估方法和项目实例。建议阅读arxiv.org/abs/2506.18096等论文,并参考github.com/bytedance/deer-flow等项目。
GitHub Copilot 提供三种主要方式来定制 AI 响应
GitHub Copilot 提供三种定制方式,包括自定义指令、可重用提示和自定义聊天模式,以适应不同工作流程及需求。更多信息参考 github.com/github/awesome-copilot
kyutai_labs把它的TTS开源了:Kyutai TTS
kyutai_labs发布TTS开源项目Kyutai TTS,支持文本流式传输和低延迟处理,可同时处理32个请求,英语和法语WER分别为2.82和3.29,目前支持英语和法语长文章。