月度归档: 2025 年 3 月
速递|红杉、Highland Europe押注AI自动化,n8n获6000万美元融资,估值2.7亿美元
n8n,一家专注于工作流自动化的初创公司,在其平台上融入AI技术后,收入增长了5倍。该公司通过筹集6000万美元资金得到了发展,并利用这笔B轮融资拓展美国市场。
DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
DeepSeek V3-0324是最新版本的小规模升级,它能够处理复杂问题如4维空间超立方体,并通过一句提示词生成完整产品页面。该模型在Xeophon的Benchmark测试中表现出色,解决了诸如“如何让7米长的甘蔗通过1米高、2米宽的门”等难题。其依然免费且开源。
独家|专访吴承霖,PH周榜冠军Coding Agents完成亿元融资,零推广月收百万美金,开源OpenManus
四周霸榜Product Hunt全球榜首。
它让普通人也能一句话做出自己的APP。其独创的类人类社会
爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 ICLR 2025
散模型的优势,解决了现有扩散模型生成长度受限、推理效率低和生成质量低的问题。通过块状扩散实现任意长度
一文看懂多模态思维链
多模态思维链(MCoT)系统综述发布,介绍了其基本概念、分类法和应用场景,并探讨了当前挑战及未来研究方向。通过推理构建视角、结构化推理视角等六大技术支柱提升模型能力,改变机器人的操作、自动驾驶的安全性、医疗诊断的速度与准确性以及教育的个性化教学等方面。论文链接:https://arxiv.org/pdf/2503.12605
DeepSeek发布V3更新:代码和审美有了质的提升,附5大维度测评
DeepSeek发布最新版本V3,代码生成能力及审美大幅提升,参数规模达到685B,已在官网等平台开放使用。新版本在数学推理、代码编写、知识问答等方面表现优秀,并支持上下文窗从64k提升至128k。
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
阿里通义千问Qwen发布新模型Qwen2.5-VL-32B-Instruct,尺寸为32B,具备更强的数学推理能力、图像解析能力和内容识别准确度,在多个基准上达到同规模SOTA表现。
DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户
DeepSeek上线新版本DeepSeek-V3-0324,参数增加至6850亿,性能提升显著。新版模型允许商用和模型蒸馏等行为,并在代码、数学等方面表现出色,引发网友期待R2和V4的发布。