日期: 2025 年 1 月 24 日
直接在本地运行的开源语音识别模型:Moonshine
Moonshine是Alibaba Cloud的开源语音识别模型,上线不到一周在GitHub上获得了1.4k星。它具有更小、更快、更准确的特点,支持断网运行,适用于现场场景,其计算需求与输入音频长度成比例。
DeepSeek R1 – 最强大的开源推理模型:包含经过蒸馏优化的 Llama 和 Qwen 模型
DeepSeek R1开源模型发布,包括Llama和Qwen蒸馏版本,支持GGUF格式和4位量化,7B模型压缩至4.68G。
哈工大教授创业!伺服驱动技术研发商「西恩科技」天使+轮获数千万融资!
哈尔滨西恩科技有限公司宣布完成数千万元天使+轮融资,经纬创投独家投资。公司致力于高端伺服驱动技术创新研发,并已获得多项专利和授权。核心团队由杨明教授领衔,拥有丰富的科研与实践经验。西恩科技在工业机器人、医疗机器人等领域取得显著成果并广泛应用于多个行业。
登上央视!七腾机器人斩获“2024新质生产力年度案例”桂冠!全新防爆四足机器人X3 stable重磅亮相!
1月20日,中央广播电视总台“2024新质生产力年度盛典”在央视二套财经频道播出,其中
七腾机器人有
北理工团队借鉴蝗虫跃翔一体特性 研制出具备陆空跨域能力的微小型仿生机器人
北京理工大学石青教授团队研发出一款模仿蝗虫多模态运动的机器人(LocustBot),融合爬行、跳跃和滑翔三种运动模式。通过单一丝杠电机实现腿足伸展与翼形折叠,结合TD3强化学习算法优化跳跃-滑翔动作策略,在野外环境中展示了良好的适应性和能量利用效率。
强如Operator也怕验证码,1450元花得值吗?第一波实测来了
量子位报道,OpenAI的Operator项目近期引起了广泛关注。尽管功能强大,但由于其早期版本仍存在局限性(如上网时遇到验证码),引发了一些用户的期待与失望。该项目展示了未来人工智能Agent的发展潜力,并被认为2025年将是Agent的关键突破之年。
贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行
近日,贾佳亚团队联手 Adobe 团队提出 GenProp 模型。GenProp 能完成几乎所有 ‘传播’ 任务,并能追踪实例(如影子、反射),弥补感知模型缺陷。它还能移除物体的 side effects,插入独立运动物体,进行物体替换和背景替换,以及编辑特效。