视觉模型落地:AI打工,干活全自动

AI 在字节发布的豆包1.5深度思考模型中应用了一项视觉理解模型,能支持对单目标、多目标等进行边界框或点提示定位,并支持3D定位。该模型已广泛应用于各类巡检商业化场景中。通过此技术,用户可以将图交给它识别所有寿司盘的位置,并输出坐标信息。

谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算

谷歌发布新款TPU v7芯片,峰值算力达4614TFlops,支持大规模并行处理和高效的内存访问。TPU v7在高带宽内存、低延迟ICN网络方面都有显著提升,并配备增强版SparseCore以支持高级排序和推荐工作负载。

超越o1&QwQ-32B,中科院SolutionRAG大幅提升复杂工程方案设计能力

中科院&通义实验室提出并开源了基于树状探索和双点思维的系统SolutionRAG,用于评估多约束复杂工程问题上的解决方案生成能力。该系统在SolutionBench上取得了最先进的性能,并显著优于现有方法,有望提升实际应用中的工程方案设计自动化和可靠性。

百度版深度思考模型免费上线!API定价比DeepSeek R1再砍一半

百度发布两款全新文心大模型,文心大模型4.5主打原生多模态;文心大模型X1是百度版深度思考模型,具备更强的理解、规划、反思和进化能力。两款大模型已同步上线并开放免费API调用,且价格约为DeepSeek R1的一半。

百度终于发布新的大模型:文心大模型4.5、思考模型X1,官网均可免费体验

百度发布文心大模型4.5和文心大模型X1,主打原生多模态与深度思考能力。文心大模型4.5支持多模态并提升多项语言能力;文心大模型X1则更强调中文知识问答、文学创作等综合应用能力,并能‘自主运用工具’。两款模型API调用价格下调一半,百度计划下半年开源文心大模型5.0。