开源
Gemini 2.5 Pro发布,前端开发能力有巨大提升,首发根据视频做网页功能。
Gemini 2.5 Pro新发布,提升代码、前端和UI开发能力。视频转代码功能首发,自动匹配设计样式,增强了动效制作。官方提供了体验链接供用户尝试。
LightPlanner:中科视语开源的轻量化具身推理大模型,赋能机器人高效决策
中科视语推出LightPlanner开源轻量化具身推理大模型,旨在提升机器人在复杂任务中的推理和决策能力。通过层次化深度推理、参数化动态技能链等技术,实现高效推理、准确决策,并支持多种硬件连接与配置。
代码辅助本地智能助手Oli,生产级MCP集成Klavis AI,实时语音聊天
Oli是基于Rust的开源代码助手,具有强大的代理功能。Klavis AI简化AI应用与生产级MCP服务器集成。Real-Time AI Voice Chat提供语音实时交互。AI Timeline跟踪人工智能领域的重大进展和模型发布时间线。ACE-Step是一个用于音乐生成的开源基础模型。
RealtimeVoiceChat:用语音与AI进行自然流畅对话的实时交互项目
RealtimeVoiceChat项目提供实时语音与AI对话功能,支持即时反馈、低延迟和多种模型引擎定制,可在GitHub上获取源码(https://github.com/KoljaB/RealtimeVoiceChat)。
英伟达开源语音识别模型!0.6B 参数登顶 ASR 榜单,1 秒转录 60 分钟音频!
英伟达发布Parakeet TDT 0.6B V2开源语音识别模型,参数仅600M,平均词错误率(WER)6.05%,可在1秒内完成60分钟音频转录,支持英文,已入驻Hugging Face Open ASR榜单首位。
颠覆金融分析!多智能体AI股票分析师震撼登场!
文章介绍了一款由两个智能体组成的系统,用于股票分析和报告撰写。核心亮点包括股票分析智能体利用基本面和技术面指标进行全方位解析,以及将复杂数据转化为专业报告的报告撰写智能体。