清华团队开源“赤兔Chitu”大模型推理引擎–推理成本降一半,性能翻番,GOOGLE快速深度研究报告生成工具

清华大学高性能计算研究所开源高性能大模型推理框架Chitu,实现国产AI芯片原生运行FP8精度模型。Gemini 2.0 Flash Image Generation and Editing利用Google Gemini 2.0 Flash生成和编辑图像。Deep Research快速生成深度研究报告,注重用户隐私本地存储数据。Xata Agent作为PostgreSQL数据库监控的开源AI助手。Agentic Radar用于扫描和分析Agentic系统安全性,识别漏洞并生成报告。

免费使用google Deep Research,Gemini 助手一系列重大升级

Google AI Studio中的Gemini 2.0 Flash实验性功能支持原生图像生成和多模态对话式编辑。它能根据用户故事描述生成插图,并且允许通过多轮对话来修改图像细节,同时还提供个性化的AI研究助手Deep Research。

港大开源论文AI撰写工具AI-Researcher,Gemma 3发布评测性能超越DeepSeek-V3部署成本少10倍

ini 2.0研发的轻量级开源模型系列,可在单GPU或TPU上运行,性能强大。
Gemma 3 是

刚刚OpenAI发布Agents SDK,Claude Pro的编程助手,Cloudflare也开源构建智 Agents框架

OpenAI发布了多智能体工作流框架OpenAI Agents SDK及其示例应用Computer Using Agent Sample App。Anus是一个开源AI代理框架,旨在通过自动化任务革新AI应用程序的开发和使用。Cloudflare Agents提供状态管理和实时通信等功能。

OpenManus开源复刻Manus,腾讯开源的图像到视频生成框架,大型音频语言CoT推理模型

OpenManus 是由 MetaGPT 团队成员构建的无需邀请码工具,让用户实现创意。HunyuanVideo-I2V 是腾讯开源的图像到视频生成框架。Light-R1-32B 超越 R1-Distill,在数学问题上表现出色且成本低廉。Audio-Reasoner 是大型音频语言模型,通过 CoT 推理在基准测试中表现优异。SolGraph 利用 Solana 链上基础设施实现快速透明的 AI 应用。

小模型大智慧-阿里巴巴开源推理模型:QwQ-32B性能媲美DeepSeek-R1,AI Agent的生产级工具集Composio

Qwen系列模型之一的QwQ-32B参数量为325亿,适用于解决难题;OpenChat是一个支持Web、移动和桌面端的AI聊天应用;Archon是用于构建和优化AI智能体的工具;Firecrawl MCP Server整合了强大的网页抓取功能;Composio提供超过250种工具和支持多种框架与认证协议。

用Agent生成Manim动画视频用来解释定理辅助教学,低资源消耗的离线翻译服务器,开源AI 写作助手

TheoremExplainAgent生成可视化的定理讲解视频;AI写作助手定制化生成高质量内容;MTranServer超低资源离线翻译服务器;ReSearch通过强化学习提升问答效果无需监督数据;CoE通过层内专家间迭代通信提高LLM性能和效率。

开源深度研究报告Shandu,阿里巴巴开源ViDoRAG提升视觉文档理解和问答效果,开源量化分析

本文介绍了5个AI研究项目:Shandu、ViDoRAG、Klee、HumanOmni和股票分析系统。它们涵盖从视觉文档检索到多模态语言模型的各个方面,包括生成报告、提升视觉理解能力、提供投资建议等功能。

大模型处理PDF文档olmOCR,DeepSeek开源DeepGEMM高效的FP8矩阵乘法库,多模态推理R1-OneVision

本文介绍了五个AI工具包和模型,包括olmOCR用于处理PDF文档、DeepGEMM优化FP8矩阵乘法、R1-OneVision多模态大语言模型、Baichuan-Audio语音交互模型以及MyCoder AI编程工具。