月度归档: 2025 年 4 月
阿里 Qwen3 正式发布,一口气开源8款模型!这个五一注定不太平!
阿里云发布Qwen3系列大模型,包含8个不同规模的模型,涵盖235B参数的大模型对标顶级模型。亮点包括双模式思考能力、超大规模预训练数据、创新后训练方法及开箱即用部署方式等。
数据中心热潮没有消退,但巨头们确实按了“暂停键”
文章指出尽管微软和亚马逊撤销了一些数据中心项目,但整体资本支出仍强劲。未来五年数据中心市场预计保持20%至25%的增长范围,主要科技公司计划投入超过3000亿美元用于AI基础设施建设。然而,能源瓶颈仍然是最大的挑战之一。
AI氛围编码一时爽,SEO 火葬场?你的Lovable编码网站能被搜到吗?
SEO专家警告使用AI建站工具时需注意客户端渲染问题。建议使用SSG或SSR来提高搜索引擎可见性。Lovable等工具默认采用CSR,导致页面内容无法被爬虫抓取。多位开发者分享了通过Next.js实现服务器端渲染的具体方法和面临的局限性。
过去四周,AI推理爆了,GPU在燃烧,英伟达依旧供不应求
大摩报告指出,英伟达GPU因主要大型语言模型对推理芯片的巨大需求而面临供不应求局面。尽管如此,供应限制和毛利率压力影响了市场情绪,但摩根士丹利仍上调了2026财年的收入和每股收益预测,并认为英伟达长期增长潜力强劲。
DeepWiki、Chatwiki及DeepSeek-R1T-Chimera进展
今日2025年4月28日星期日,北京晴。简述Deepresearch与RAG进展及DeepSeek-R1实验模型。DeepWiki为GitHub仓库提供AI驱动的实时交互式文档;Chatwiki为企业打造智能客服机器人问答系统,支持多级权限控制和多种数据导入方式。介绍DeepSeek-R1T-Chimera微调模型,相比原始版本运行速度更快,输出标记数量减少40%。