推理、训练、数据全链条的工程挑战,谁在构建中国 AI 的底层能力?|AICon 北京
AICon 全球人工智能开发与应用大会·北京站聚焦国产 AI 基础设施建设的系统层关键议题,涵盖国产芯片推理适配、开源部署实践、大规模训练容错机制等多个方向。
AICon 全球人工智能开发与应用大会·北京站聚焦国产 AI 基础设施建设的系统层关键议题,涵盖国产芯片推理适配、开源部署实践、大规模训练容错机制等多个方向。
清华大学高性能计算研究所开源高性能大模型推理框架Chitu,实现国产AI芯片原生运行FP8精度模型。Gemini 2.0 Flash Image Generation and Editing利用Google Gemini 2.0 Flash生成和编辑图像。Deep Research快速生成深度研究报告,注重用户隐私本地存储数据。Xata Agent作为PostgreSQL数据库监控的开源AI助手。Agentic Radar用于扫描和分析Agentic系统安全性,识别漏洞并生成报告。
专注AIGC领域的专业社区,聚焦微软&OpenAI、百度文心一言等大语言模型的发展与应用。清华大学高性能计算研究所团队开源了名为‘赤兔Chitu’的大模型推理引擎,首次实现在非英伟达H系列GPU及国产芯片上原生运行FP8精度模型,有效突破部署限制。
清华系科创企业清程极智联合清华大学团队开源大模型推理引擎”赤兔”,支持非H卡设备运行原生FP8模型,相比vLLM方案,使用GPU数量减少50%,输出速度提升3.15倍。
清程极智获新一轮融资,由北京市人工智能产业投资基金、中科创星及考拉基金等投资。该公司专注于智能算力系统软件开发,致力于解决国产芯片使用不便和效率低等问题,并推出自研的高性能推理引擎。