AI工程化
国内首部AI大模型私有化部署标准启动编制,适合10类企业参与!
智合标准中心联合公安部第三研究所、工业和信息化部第五研究所启动《人工智能大模型私有化部署技术实施与评价指南》团体标准编制工作,旨在填补大模型部署空白,并促进其健康发展。
重磅!Anthropic 发布新一代混合推理模型Claude 3.7 Sonnet,编程能力再上台阶
Anthropic公司发布了Claude 3.7 Sonnet和Claude Code两个模型,前者具备混合推理能力,后者则是一个面向开发者的智能编码助手。Claude 3.7 Sonnet在编码和前端网页开发方面表现出强大的性能,并能更好地处理复杂的代码库。Claude Code作为命令行工具,简化了开发者的工作流程,能够进行多种编码任务,如编写测试、提交代码等,显著减少了开发时间和工作量。
DeepSeek首日开源FlashMLA,H800的推理性能提升2-3倍!
首个开源代码库FlashMLA针对英伟达Hopper架构GPU优化,支持BF16数据类型和分页KV缓存,提供高性能计算与内存吞吐,在内存限制配置下推理性能提升2-3倍,计算限制配置下提升约2倍。
国内首部AI数据标注合规标准启动编制,由7家机构共同发起
文章介绍了AI数据标注产业面临的合规问题,并启动了《面向人工智能的数据标注合规指南》团体标准研制。该标准旨在解决数据来源、标注内容与过程操作、人员管理、数据安全和隐私保护等问题,为AI企业提供低成本的解决方案。
Unsloth 再升级,Qwen2.5-1.5B 模型微调仅需 5GB 显存,较2周前再降29%
近日,Unsloth 团队升级了微调框架,使得使用其Qwen2.5-1.5B模型仅需5GB显存,相比之前减少了约29%。新的Efficient GRPO算法通过优化内存使用效率,使VRAM需求降至原本的54.3GB。
Deep Research技术盘点!比RAG更高级的LLM应用范式
OpenAI的Deep Research工具推出后,多家厂商跟进开发了类似的应用。基于现有框架或专门设计的开源实现项目提供了快速构建和了解Deep Research应用的方法。
Cline 3.4 版本上线MCP Marketplace,或将迎来 AI App Store时刻
Cline 推出 MCP 应用商店简化 AI 功能安装管理,让更广泛受众轻松使用 AI 工具,实现大众化 AI 开发体验。
重磅!OpenAI老班底创立Thinking Machines Lab,致力于践行Open AI
Thinking Machines Lab由前OpenAI成员组成,包括Lilian Weng、John Schulman等。该公司强调开源共享、平等享用人工智能,并致力于研发多模态系统和安全措施。