10万+,超大规模人手交互视频数据集!面向可泛化机器人操作|CVPR 2025

香港中文大学(深圳)发布TASTE-Rob数据集,包含100,856个精准匹配语言指令的第一视角交互视频。该团队提出三阶段视频生成流程优化手部姿态,显著提升视频真实感和机器人操作准确度。

豪掷亿元!百度第三届“文心杯”创业大赛启动,重金寻找AI应用“破局者”|

百度今日宣布第三届‘文心杯’创业大赛正式启动,提供近亿元投资支持大模型技术创新与应用落地。大赛设有多个奖项,最高特别大奖可达7000万人民币,并涵盖技术、场景和资金资源等多方面赋能。

等到了!VLM-R1完整细节首度公开:RL的一小步,视觉语言模型推理的一大步

VLM-R1 是一个专注于视觉感知任务的强化学习模型,它通过引入格式奖励和准确率奖励机制,在Referring Expression Compression和Open-Vocabulary Object Detection两个任务上取得了显著优势。论文详细解释了其技术细节,并展示了在大规模模型中的泛化能力和潜力。

4月28日上海,「AI共潮生——2025甲子引力X科技产业新风向」大会等你来|甲子引力X

上海工业智能中心举办的”AI共潮生——2025甲子引力X科技产业新风向”大会即将举行,涵盖技术趋势预测、领袖对话、产业落地圆桌讨论等内容。大会将发布《AI共潮生:2025人工智能产业30条判断》报告,并邀请多位行业专家分享见解和经验。

哥大退学网红AI作弊器,亲测翻车!搅黄会议划水90s,创始人承认仅是雏形

新智元报道:外媒记者测试 ‘Cheat Everything’ 作弊神器,发现其反应慢、回答几乎无法使用,并在工作会议中造成麦克风问题。虽然宣传效果夸大,但实际功能不足。Roy Lee承认产品仍处于早期阶段。