智谱开源大模型冲上世界第一! 2025年7月9日23时 作者 路过银河AI 今天的huggingface第一名是智谱的GLM-4.1V-9B-Thinking。该模型在视觉语言任务中表现出色,参数量小但性能接近大模型,支持多模态和双语处理。
刚刚,DeepSeek全新注意力机制NSA发布,超快速长文训练与推理~ 2025年2月19日14时 作者 PaperAgent DeepSeek官推发布NSA技术成果,一种面向硬件且支持原生训练的稀疏注意力机制,显著提升了长上下文训练与推理速度和成本。