DecoupledGaussian:用于基于物理交互的物体与场景解耦

DecoupledGaussian提出了一种创新方法从野外视频或多视角图像中分离物体与其接触场景,支持物体在受力后发生复杂物理现象的实时交互模拟。通过高斯散射与联合泊松场技术,该方法提高了恢复精度和真实感。

「让通用机器人成为现实」,谷歌RT-2、PaLM-E作者离职创业,已获英伟达投资

谷歌DeepMind高级研究科学家Pete Florence创建新公司,专注于机器人技术。目标是制造能做任何事情的机器人,让体力劳动边际成本接近零。该公司已获得英伟达投资。

波士顿动力真「翻」不过宇树、众擎!一觉醒来,全世界的机器人都在侧空翻

波士顿动力Atlas发布侧空翻视频引发关注,宇树机器人宇树G1实现凌空侧空翻。对比发现,Atlas在执行侧空翻时仍需双手撑地,而G1则完全凌空。Atlas展示了多种动作,包括向前、阴暗爬行和类似人类的踢踏舞,但其动作流畅度超乎想象。

AI Agent真的安全吗?南洋理工最新综述揭秘LLM Agent安全风险与防御策略

A Survey on Trustworthy LLM Agents: Threats and Countermeasures, a study by researchers from Nanyang Technological University and Squirrel AI, categorizes Agent safety issues into internal (Brain, Memory, Tool) and external (User, Agent, Environment) modules. It provides insights for future research directions such as collaborative security mechanisms and adversarial robustness training methods.

一个算法让LLM创新能力暴增,原来是AI学会了进化

近日研究成果展示了如何利用LLM结合进化算法设计出新颖的创意时钟和纹理动画。该算法名为Lluminate,由Joel Simon提出,它结合了进化计算原理与大型语言模型。实验表明,使用形式化的创造性思维策略可以显著提高新颖性指标,而修改现有artifact比从头开始生成新artifact更多样化。

更精细的解耦评估!VisualSimpleQA开创视觉语言大模型事实问答评测新范式

VisualSimpleQA 提出了一个面向事实查询的多模态评测基准,旨在有效评估大型视觉语言模型(LVLMs)在事实问答任务中的表现。该基准采用了解耦评估框架和明确的样本难度标准,能够区分不同模型的表现,并揭示了当前前沿 LVLMs 在视觉和语言模块上的改进空间。