小兵的AI视界
家庭服务机器人要逆天!Embodied-Reasoner:自动规划路径、搬运物品,复杂任务一网打尽
键桥梁。它要求智能体通过感知、推理和行动与物理环境动态交互,以完成复杂任务
。然而,
传统具身智能模
EmotiVoice:网易免费开源TTS引擎,2000种音色+情感控制!狂揽7900星
网易有道开源的EmotiVoice是一款支持多语言、海量音色和情感合成的TTS系统,具有高效部署、易用接口和语音克隆等功能,在内容创作、智能语音助手、教育、客服系统及娱乐游戏等领域具有广泛应用前景。
LightPlanner:中科视语开源的轻量化具身推理大模型,赋能机器人高效决策
中科视语推出LightPlanner开源轻量化具身推理大模型,旨在提升机器人在复杂任务中的推理和决策能力。通过层次化深度推理、参数化动态技能链等技术,实现高效推理、准确决策,并支持多种硬件连接与配置。
无需标注数据!清华TTRL让AI自学正确率飙升159%,数学题秒变送分题
清华大学和上海人工智能实验室提出测试时强化学习(TTRL),通过在无标签数据上利用多数投票等方法估计奖励信号来提升大规模语言模型性能。
F5R-TTS:腾讯出品,TTS领域的新王者?流匹配+强化学习,语音克隆新高度!
F5R-TTS是一款基于流匹配技术的新型文本到语音(TTS)系统,通过引入强化学习算法特别是梯度奖励策略优化(GRPO),显著提升了语音合成的清晰度和说话人相似度。该系统在零样本语音克隆任务中表现出色,在多语言支持、情感控制及速度调整等方面也具有优势。