99后华人科学家创业,掏出全球首个视觉记忆大模型,无限上下文,已获三星投资
Memories.ai联合创始人沈俊潇宣布推出首款大型视觉记忆模型,该模型在视频分类、检索和问答基准测试中性能远超谷歌OpenAI,并已完成800万美元种子轮融资。
Memories.ai联合创始人沈俊潇宣布推出首款大型视觉记忆模型,该模型在视频分类、检索和问答基准测试中性能远超谷歌OpenAI,并已完成800万美元种子轮融资。
清华大学与生数科技合作研发的FreeAudio系统突破10秒时长限制,实现精准时间控制和长时音频生成,3大核心技术包括LLM规划、解耦与聚合注意力控制及上下文潜变量合成等。该系统在多项指标上得分最优,在主观评估中质量最高。未来或将在Vidu产品端上线,并计划进一步探索更长时间段的音频生成技术。
零一万物发布万智企业大模型平台2.0及企业级Agent产品‘超级员工’,结合工作流Agent与推理Agent帮助企业提升效率。该产品可学习进化、私有化部署,并支持接入已有智能体,旨在通过深度共建实现产业落地。
国产大模型‘六小虎’之一的MiniMax发布Agent全栈开发功能,支持一键构建完整的全栈应用,涵盖Supabase后端托管、Stripe支付集成等技术特性,可实现API调用、实时数据处理等功能。
微软再次启动裁员计划,影响近9000名员工。这是该科技巨头今年第2轮大规模裁员,旨在优化流程并减少管理层级。此次裁员主要针对销售团队,并转向AI导向重组。
谷歌发布开源AI智能体Gemini CLI,支持通过自然语言实现代码编写、问题调试及工作流优化,并提供免费试用许可和专业开发者付费选项。该工具基于MCP等标准构建,共享技术底座与Gemini Code Assist,已在VS Code中启用智能体模式并开放免费使用。