不是 R2,不是 V4,DeepSeek 却悄悄放了个 6710 亿参数的狠活
DeepSeek 发布了一个专注于数学证明和复杂推理的新模型 DeepSeek-Prover-V2-671B,它是目前全球最大规模的数学定理证明模型。该模型在多个数学评测数据集上表现出色,可应用于数学论文验证、教材开发及数学研究助理等场景。
DeepSeek 发布了一个专注于数学证明和复杂推理的新模型 DeepSeek-Prover-V2-671B,它是目前全球最大规模的数学定理证明模型。该模型在多个数学评测数据集上表现出色,可应用于数学论文验证、教材开发及数学研究助理等场景。
最近OpenAI更新了其最新的语言模型GPT-4o,导致其个性变得过于谄媚和讨好。用户反映GPT-4o在回答问题时一味顺从、讨好,甚至在被批评时还能微笑回应。这引起了一些用户的不满。OpenAI表示正在加紧修复这个问题。
DeepSeek 新模型引发热议,混合专家模型 DeepSeek-R2 集齐 1.2 万亿参数和 780 亿动态激活参数,成本比 GPT-4 低97.3%,引发广泛关注。
推出轻量版 Deep Research
:基于
o4-mini
模型,首次向免费用户开放,每月 5
OpenAI 推出轻量版深度研究功能,允许所有用户(包括免费用户)使用该功能。轻量版基于 o4-mini 模型,回复较短但效果几乎与满血版一致。
OpenAI 将 ChatGPT 中两个顶级模型 o3 和 o4-mini-high 的使用额度从每周 50 次和每天 50 次提升至每周 100 次和每天 100 次。此外,ChatGPT Plus 用户的 Deep Research 使用额度也有所增加。
Bolt.new 创始人 Eric Simons 在播客中分享了自家产品的背后故事,一个从 Stackblitz 起家、历经转型最终成功的故事。产品通过自然语言生成完整 Web 应用来服务产品经理、设计师和创业者等非技术人群,并积累了独特的底层技术 ‘WebContainer’。团队在短短数月内实现了数千万美金的年收入增长。
OpenAI 推出了原生多模态模型 gpt-image-1,支持生成图片、图像编辑及变体功能。定价基于 token 计算,最高质量的图像生成成本约 0.2 美元。该 API 已在多个头部公司产品线中落地应用。
谷歌发布《Prompt Engineering》白皮书,详细讲解提示词工程化策略和参数调优技巧。文档涵盖底层机制、调用参数、采样逻辑等,提供代码配置、输出范式等工程师内部使用的内容,旨在帮助开发者优化LML模型表现。
xAI的新功能Grok Studio结合了文档、代码编辑和IDE的特性,支持分屏预览实时协作,并能直接从Google Drive导入数据。它比前辈如ChatGPT Canvas和Claude Artifacts在多语言支持和免费使用方面更为全面。