TEN VAD(语音活动检测) 2025年5月24日8时 作者 NLP工程化 TEN VAD 是一个轻量级流式语音活动检测模型,具有低延迟、低功耗和高准确率的优势,用于预处理语音输入的大语言模型(LLM)。
Agent S2:像人一样操作 GUI,开源 AI 智能体新突破 2025年4月28日14时 作者 子非AI 人一样直接操作电脑和手机的 图形用户界面 (GUI) ,完成各种任务。 • 牛在哪? 在 OSWor
语音交互革命!开源神器Oliva:一句话秒搜海量数据,多AI协作颠覆传统搜索 2025年4月17日14时 作者 小兵的AI视界 用户对高效、便捷语音交互体验的需求,众多创新项目应运而生。其中, Oliva 作为一款开源语音 RA
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1 2025年3月31日23时 作者 机器之心 这款神器叫做 「AutoGLM 沉思」 ,来自中国公司智谱。 我们来看一个非常经典的案例:只需要输出
AI+Agent:现状与未来发展趋势全面解读(36页深度报告) 2025年3月31日14时 作者 AI技术研习社 《AI+Agent现状与发展趋势报告》详细分析了技术融合与创新应用、市场格局与竞争格局、技术挑战与解决方案以及未来趋势,揭示了AI+Agent在智能客服、自动驾驶等领域的广泛应用及其未来潜力。