赛博禅心

Llama 4 发布：我看到了 DeepSeek 的影子

2025年4月6日14时作者赛博禅心

Llama 4 发布三款模型：Scout、Maverick 和 Behemoth。参数量分别为109B、400B和2T；Maverick 在多项任务上超越GPT-4，并且推理成本仅为其十分之一。

2025年4月3日19时作者赛博禅心

ShowMeAI
大聪明 @ 赛博禅心
—
说明:
① 本文分类中的【模型】均指代语言模型；

2025年4月2日19时作者赛博禅心

ct’;

function _arrayLikeToArray$2(arr, len) {

2025年4月1日19时作者赛博禅心

今天没有发布会，只是看到了一组数据：中国智能汽车销量Top5里有三款搭载了大模型。文章讨论了AI落地的变化，从被动服务到主动执行，以及AI在各种应用场景中的实际运行状态。强调模型需要稳定可靠地“上班”，而非只关注其功能和性能指标。

2025年3月31日14时作者赛博禅心

GLM 登场，参与了《读者》的有偿征文，全自动赚金币。
“帮我在小红书上找一找有哪些「非网红、排队少

2025年3月29日14时作者赛博禅心

文章介绍了Gemma-3和DeepSeek V3在参数量上的对比，并指出模型效果不仅仅取决于参数大小。通过详细解释Dense和MoE架构的区别及其实际应用效果，强调了参数数量并不能直接反映模型性能优劣的观点。同时讨论了知识蒸馏技术如何让小模型继承大模型的能力，而不仅仅是关注模型的规模大小。

2025年3月27日19时作者赛博禅心

文章讨论了在实际应用中自主AI系统（Agent）面临的挑战和问题，包括执行效果评估、危险行为界定、默认行为确定、推理透明展示、Agent行为监控、作恶追责及严重事故叫停等难点。强调了需要解决复杂性、风险管理和责任划分等问题。

2025年3月26日14时作者赛博禅心

ChatGPT通过4o模型发布新功能，能够生成高质量图像，并根据对话进行修改。它能处理复杂的场景、风格多样且指令遵循能力强。然而，也存在一些限制和潜在问题。

2025年3月21日14时作者赛博禅心

OpenAI 发布三款新模型：语音转文本（STT）和文本转语音（TTS），以及一个调试工具网站 OpenAI.fm。STT 模型价格更优且性能更好；TTS 效果一般但可控性强；PlayGround 界面友好，支持代码导出功能。

2025年3月18日14时作者赛博禅心

夸克推出的新功能”超级框”旨在简化用户需求转化为结果的过程，通过引导用户表达意图，AI能够实现用户的实际需求。它展示了从以对话为中心到以交付为中心的转变趋势。

较早文章

较新文章