日期: 2025 年 4 月 29 日
阿里 Qwen3 正式发布,一口气开源8款模型!这个五一注定不太平!
阿里云发布Qwen3系列大模型,包含8个不同规模的模型,涵盖235B参数的大模型对标顶级模型。亮点包括双模式思考能力、超大规模预训练数据、创新后训练方法及开箱即用部署方式等。
数据中心热潮没有消退,但巨头们确实按了“暂停键”
文章指出尽管微软和亚马逊撤销了一些数据中心项目,但整体资本支出仍强劲。未来五年数据中心市场预计保持20%至25%的增长范围,主要科技公司计划投入超过3000亿美元用于AI基础设施建设。然而,能源瓶颈仍然是最大的挑战之一。
AI氛围编码一时爽,SEO 火葬场?你的Lovable编码网站能被搜到吗?
SEO专家警告使用AI建站工具时需注意客户端渲染问题。建议使用SSG或SSR来提高搜索引擎可见性。Lovable等工具默认采用CSR,导致页面内容无法被爬虫抓取。多位开发者分享了通过Next.js实现服务器端渲染的具体方法和面临的局限性。
过去四周,AI推理爆了,GPU在燃烧,英伟达依旧供不应求
大摩报告指出,英伟达GPU因主要大型语言模型对推理芯片的巨大需求而面临供不应求局面。尽管如此,供应限制和毛利率压力影响了市场情绪,但摩根士丹利仍上调了2026财年的收入和每股收益预测,并认为英伟达长期增长潜力强劲。
DeepWiki、Chatwiki及DeepSeek-R1T-Chimera进展
今日2025年4月28日星期日,北京晴。简述Deepresearch与RAG进展及DeepSeek-R1实验模型。DeepWiki为GitHub仓库提供AI驱动的实时交互式文档;Chatwiki为企业打造智能客服机器人问答系统,支持多级权限控制和多种数据导入方式。介绍DeepSeek-R1T-Chimera微调模型,相比原始版本运行速度更快,输出标记数量减少40%。
阿里 Qwen 团队深夜放毒,Qwen3 大模型家族来了!超越 DeepSeek-R1 与 o1?
Aitrainee介绍并评测了阿里巴巴发布的Qwen3模型系列,包括多种参数规模的MoE和Dense模型,并展示了其在性能、多语言支持和推理预算方面的优势。
最强开源模型!阿里发布并开源Qwen3,无缝集成思考模式、多语言、便于Agent调用
阿里巴巴发布Qwen3系列模型,包括两个专家混合(MoE)模型和六个Dense模型,并开源了部分权重。该系列在多个基准测试中表现出与OpenAI等顶级模型相当的性能。Qwen3还具有高效的“思考模式”,支持119种语言且训练数据量是Qwen2.5的两倍,有助于Agent调用。部署成本显著降低,整体推理成本也有所节省。