演讲生成黑科技,PresentAgent从文本到演讲视频

本项目提出 PresentAgent 系统,能够将长篇文档转化为带解说的演示视频。PresentAgent 通过模块化流程实现视觉和语音同步生成,并引入 PresentEval 评估框架全面考量内容、视觉与理解质量。

即将截止!AI应用产业全景图谱申报倒计时

2025年AI技术将深入千行百业。北京智合标准中心发布全国首个AI应用产业全景图谱,涵盖基础技术、产业融合等五大层,并提供政策、资本等支持。欢迎更多单位申报,包括案例展示、形象塑造、资源链接及标准编制机会。

阿里PC-Agent重构人机交互,精准拆解跨应用指令,自动化办公更进一步

阿里通义实验室提出PC-Agent框架,实现复杂PC任务自动化。该框架通过主动感知模块和层次化多智能体协作结构处理跨应用工作流指令。实验表明其在复杂任务上表现优于现有方法。