Runway上新Gen-4,角色、场景一致性顶尖,我们小测了下可灵1.6
今年以来,各类AI产品和模型层出不穷。近日,Runway发布了其最新研发的Gen-4 AI视频生成模型,实现了高保真度、一致性及指令遵循度的显著提升,并能保持角色、物体和场景的一致性。
今年以来,各类AI产品和模型层出不穷。近日,Runway发布了其最新研发的Gen-4 AI视频生成模型,实现了高保真度、一致性及指令遵循度的显著提升,并能保持角色、物体和场景的一致性。
金沙江创投主管合伙人朱啸虎退出机器人公司,称“商业化路径不清晰”。这一举动与人形机器人赛道的火热形成鲜明反差。朱啸虎表示,退出基于宏观策略调整,并强调自己并未与具体公司交流。部分被投企业对朱啸虎的态度进行了回应。
最近社交媒体上流行起‘万物皆可吉卜力’现象,OpenAI的GPT-4模型使人们可以将照片变成吉卜力动画风格。然而,这一趋势引发了一些法律和伦理问题,包括可能侵犯知识产权及技术与艺术的关系讨论。
OpenAI 推出的 GPT-4o 是一个原生多模态模型,能够直接从文本提示生成精确、逼真的图像。它在准确渲染文本、精确遵循提示以及利用固有知识库和聊天上下文方面表现出色。
Google发布全新大模型Gemini 2.5 Pro,支持100万个token上下文窗口,在编程、数学等领域全面领先。Gemini 2.5 Pro在各大基准测试中均实现第一,并且具备强大的逻辑推理和编程能力。
近日科技圈大V巴拉吉认为中国正试图将AI作为‘补充品’商品化,并预计会大规模推出开源AI模型。他推测中国的盈利点在于AI硬件,旨在通过复制、优化和规模化生产以低价摧毁西方的原版产品。
作者|子川来源|AI先锋官新视觉语言模型Qwen2.5-VL-32B开源,相比72B规模更小但表现不俗。它在多个测试中击败了包括Gemma 3 27B在内的同尺寸模型。
随着AI技术的发展,Claude 3.7 Sonnet在编程能力测试中获得高分引发热议。多位专家预测未来90%的程序员岗位可能被取代,但也有不同声音指出AI不会完全替代人类程序员。
DeepSeek发布V3-0324版本升级,参数规模达685B的混合专家模型在编程、数学推理等领域性能大幅提升。该版本接近Claude 3.7 Sonnet水平,编码能力排名第三。