提升性能归档

智谱新版VLM开源模型 GLM-4.1V-9B-Thinking

2025年7月3日8时作者 NLP工程化

基于GLM-4.1V-9B-Thinking模型，引入强化学习技术提升视觉语言模型能力，在18个任务中与8倍参数量的Qwen-2.5-VL-72B相当或超越

2025年6月27日16时作者机器之心

界 SOTA 。
一、Agentless 、44% 与 NO.1
说到 AI 写代码的实力，大家最关

2025年6月22日16时作者新智元

L用超2000步训练配方给出了响亮的答案。仅15亿参数模型，媲美Deepseek-R1-7B，数学、

2025年6月17日16时作者新智元

方式，借助KV Cache和并行解码，将Diffusion LLM推理加速达27.6倍。
如果你看过

2025年4月8日16时作者新智元

和港中文学者带来ImageGen-CoT技术，让AI像人一样思考推理，生成超惊艳画作，性能提升高达8

2025年3月26日16时作者机器之心

研究团队首次提出Video-T1方法，通过Test-Time Scaling显著提升视频生成性能，提出Tree-of-Frames方法优化搜索效率和生成质量。

2025年3月25日14时作者 AI信息Gap

DeepSeek发布新模型DeepSeek-V3-0324，参数量685B，支持BF16、F8_E4M3和F32三种精度格式。主要提升性能和修复bug。

2025年3月16日8时作者 GitHubStore

人大和阿里开源的GraphAgent是一个利用大型语言模型来模拟人类行为并生成动态社交图的框架，适用于在线社交媒体、电子商务和论文创作等场景。它通过生成带有文本属性的社会图，揭示网络中的互动，并在多个指标上优于现有方法。

2025年2月20日23时作者 Founder Park

tter上公布了最新论文：
Native Sparse Attention: Hardware-Al

2025年1月31日16时作者新智元

新智元报道
编辑：KingHZ
【新智元导读】
谷歌提出了多智能体协作的新方法「智能体链」（Chai