清华团队开源“赤兔Chitu”大模型推理引擎–推理成本降一半,性能翻番,GOOGLE快速深度研究报告生成工具

清华大学高性能计算研究所开源高性能大模型推理框架Chitu,实现国产AI芯片原生运行FP8精度模型。Gemini 2.0 Flash Image Generation and Editing利用Google Gemini 2.0 Flash生成和编辑图像。Deep Research快速生成深度研究报告,注重用户隐私本地存储数据。Xata Agent作为PostgreSQL数据库监控的开源AI助手。Agentic Radar用于扫描和分析Agentic系统安全性,识别漏洞并生成报告。

破解国产芯片FP8及DeepSeek部署难题,清华团队开源“赤兔Chitu”大模型引擎

专注AIGC领域的专业社区,聚焦微软&OpenAI、百度文心一言等大语言模型的发展与应用。清华大学高性能计算研究所团队开源了名为‘赤兔Chitu’的大模型推理引擎,首次实现在非英伟达H系列GPU及国产芯片上原生运行FP8精度模型,有效突破部署限制。