AI先锋官
马斯克白宫谈话:10 年内AI认知将超过人类,90%里程将为自动驾驶
埃隆·马斯克在白宫接受采访时预测,未来10年内人工智能的认知能力可能会超过人类,并预计会有大量人形机器人出现。他强调需要重视国内人工智能芯片制造能力的建设。
实测百度文心大模型X1.vs.阿里Qwen2.5,文心大模型4.5.vs.Gemini 2.0
百度发布文心大模型4.5和X1,价格分别为0.004/0.016元/千tokens和0.002/0.008元/千tokens。文心4.5在多模态任务上表现优异,而文心X1能自主运用工具并具备更强的理解、规划、反思能力。
阶跃星辰CEO姜大昕:汽车是AI Agent最关键落地场景
阶跃星辰在上海举办首届Step UP生态开放日,透露多模态推理和Agent智能体技术作为未来重点关注方向,并发布全新升级的‘繁星计划’2.0。
这回眸凝视仿佛硅基生命觉醒!Figure 发布能听懂人话不用训练的机器人通用大脑Helix
芜湖!机器人开始走出实验室,走进家庭,能做家务了。Figure的最新研究成果——视觉-语言-动作(VLA)模型Helix,让两台搭载该模型的机器人共享同一智能大脑,通过自然语言指令进行分工合作。
Sora发布即翻车,谷歌Veo2偷塔AI视频新王?
谷歌新发布的Veo2视频生成模型在分辨率和时长上都有所提升,并能理解物理规律与电影语言。它通过4D卷积神经网络和GAN架构提高了逼真度,但可能面临Sora一样的问题,如复杂的场景处理、用户期望与实际性能之间的差距等挑战。
实测谷歌Gemini 2.0:数数、推理翻车,多模态惊艳,编程输Claude
谷歌三位CEO联合宣布Gemini 2.0 Flash发布,性能超越Gemini 1.5 Pro,并在多模态能力上表现出色。但在经典题目的推理和编程能力测试中表现一般,实测结果引人思考。
新增视频编辑功能,OpenAI最大期货Sora兑现,奥特曼称其视频版 GPT-1
Sora Turbo即将发布,支持生成一分钟视频、多场景切换和角色一致性。OpenAI在最新发布会上展示了Sora的强大功能及其编辑能力,包括Remix、Re-Cut和Blend技术。