DecoupledGaussian:用于基于物理交互的物体与场景解耦
DecoupledGaussian提出了一种创新方法从野外视频或多视角图像中分离物体与其接触场景,支持物体在受力后发生复杂物理现象的实时交互模拟。通过高斯散射与联合泊松场技术,该方法提高了恢复精度和真实感。
DecoupledGaussian提出了一种创新方法从野外视频或多视角图像中分离物体与其接触场景,支持物体在受力后发生复杂物理现象的实时交互模拟。通过高斯散射与联合泊松场技术,该方法提高了恢复精度和真实感。
谷歌DeepMind高级研究科学家Pete Florence创建新公司,专注于机器人技术。目标是制造能做任何事情的机器人,让体力劳动边际成本接近零。该公司已获得英伟达投资。
HyperAI超神经上线了使用vLLM部署Gemma-3-27B-IT教程,该模型支持文本和图像输入,适用于问答、摘要和推理等多种任务。
华为诺亚决策推理实验室综述了生成模型在智能决策中的应用。文章介绍了七种主要的生成模型,并探讨了它们如何在机器人控制、结构优化、游戏 AI 和优化问题等领域中提升决策性能。
波士顿动力Atlas发布侧空翻视频引发关注,宇树机器人宇树G1实现凌空侧空翻。对比发现,Atlas在执行侧空翻时仍需双手撑地,而G1则完全凌空。Atlas展示了多种动作,包括向前、阴暗爬行和类似人类的踢踏舞,但其动作流畅度超乎想象。
A Survey on Trustworthy LLM Agents: Threats and Countermeasures, a study by researchers from Nanyang Technological University and Squirrel AI, categorizes Agent safety issues into internal (Brain, Memory, Tool) and external (User, Agent, Environment) modules. It provides insights for future research directions such as collaborative security mechanisms and adversarial robustness training methods.
近日研究成果展示了如何利用LLM结合进化算法设计出新颖的创意时钟和纹理动画。该算法名为Lluminate,由Joel Simon提出,它结合了进化计算原理与大型语言模型。实验表明,使用形式化的创造性思维策略可以显著提高新颖性指标,而修改现有artifact比从头开始生成新artifact更多样化。
VisualSimpleQA 提出了一个面向事实查询的多模态评测基准,旨在有效评估大型视觉语言模型(LVLMs)在事实问答任务中的表现。该基准采用了解耦评估框架和明确的样本难度标准,能够区分不同模型的表现,并揭示了当前前沿 LVLMs 在视觉和语言模块上的改进空间。