跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Qwen

DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升!

2025年2月17日19时 作者 Datawhale

DeepSeek团队通过CODEI/O项目,利用300多万个实例将代码转换为思考过程训练大模型,提升其在多种推理任务中的性能,并证明了这种训练方法对不同规模和领域模型的有效性。

分类 分享 标签 300万、 CODEI/O、 DeepSeek、 Junlong Li、 Qwen、 验证机制 发表评论

飞书的多维表格接入了DeepSeek R1后,这个时代的玩法,变了。

2025年2月15日8时 作者 开源星探

文章讲述了通过接入DeepSeek R1到飞书多维表格,大幅提升了数据处理效率的故事,并分享了具体操作步骤和实际应用案例。

分类 开源 标签 DeepSeek R1、 Qwen、 可视化图表、 多维表格系统、 数据分析、 阿里云 发表评论

AI 模型幻觉评测榜单:Gemini 2.0 领跑,GPT-4 紧随其后,国产模型智谱领先

2025年2月9日23时 作者 AI工程化

Vectara 发布AI大语言模型幻觉评测榜单,Qwen表现不佳幻觉率2.8%-3.0%。

分类 分享 标签 deepseek v3和r1、 Google Gemini 2.0、 OpenAI o3-mini-high-reasoning、 Qwen、 Vectara、 国产模型智谱glm-9b 1 条评论

DeepSeek-R1 是怎么训练的|深度拆解

2025年2月7日14时 作者 赛博禅心

eepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网:
R1

分类 分享 标签 DeepSeek、 GRPO算法、 Qwen、 R1模型、 奖励机制设计、 模型蒸馏 发表评论

组团开源,Qwen2.5-VL转角遇见DeepSeek Janus-Pro!

2025年1月28日14时 作者 PaperAgent

今天除夕,阿里千问开源了Qwen2.5-VL模型,包含3B、7B和72B三个尺寸,并具有感知丰富世界、作为视觉Agent、理解长视频和捕捉事件、精准的视觉定位及结构化输出等新特性。

分类 分享 标签 72B、 Qwen、 多模态模型、 视觉理解和操作、 阿里千问、 预训练语言模型 发表评论

Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

2025年1月27日16时 作者 量子位

阿里云Qwen模型首次将上下文扩展至1M长度,实现了长文本任务的稳定超越GPT-4o-mini,并提升了推理速度7倍。该模型分为长上下文训练、长度外推和稀疏注意力机制三大步骤。

分类 资讯 标签 1M长度、 7倍提速、 Qwen、 上下文扩展、 提升效果、 稀疏注意力机制 发表评论

阿里Qwen2.5-1M开源,仅320G可推理14B百万token

2025年1月27日14时 作者 PaperAgent

阿里千问开源了Qwen 2.5-1M模型及其对应的推理框架,支持百万Token上下文处理,并分享了训练和推理框架的设计细节及消融实验结果。

分类 分享 标签 1M长度、 Qwen、 上下文长度、 消融实验、 稀疏注意力、 阿里云 发表评论

DeepSeek R1 – 最强大的开源推理模型:包含经过蒸馏优化的 Llama 和 Qwen 模型

2025年1月24日16时 作者 NLP工程化

DeepSeek R1开源模型发布,包括Llama和Qwen蒸馏版本,支持GGUF格式和4位量化,7B模型压缩至4.68G。

分类 开源 标签 7B量化、 DeepSeek R1、 GGUF格式、 Llama、 Qwen、 深度学习蒸馏 发表评论

开源多模态大模型是红绿色盲吗?

2025年1月17日14时 作者 机器学习算法与自然语言处理

MLNLP社区分享了对几个开源视觉大模型进行红绿色盲测试的结果,结果显示这些模型在识别图片中的数字上表现不佳,但在实际应用场景中(如识别红绿灯)还能正常工作。

分类 学术 标签 MLNLP、 Qwen、 团队、 开源视觉大模型、 数字识别、 红绿灯 1 条评论

第一批小红书的假老外已经开始发财了

2025年1月17日12时 作者 路过银河AI

小红书上的AI绘画模型CyberRealistic Pony生成逼真的外国人照片,涵盖雪景、室内、光影等多个场景提示词。可用于鉴别网络用户的真伪。

分类 分享、 大模型 标签 AI绘画模型、 CyberRealistic Pony、 Qwen、 换脸插件、 鉴别能力、 高仿真人像 2 条评论
较早文章
较新文章
← 上一页 页面1 … 页面8 页面9 页面10 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 电影级视频大作,阿里万相2.2开源发布
  • 智谱GLM-4.5一手实测
  • 国家育儿补贴方案公布,每孩每年3600元!
  • WAIC 2025现场直击|国产AI算力逆风起飞,多种技术路径大突围
  • 字节跳动刚把自己招牌AI Agent开源了,可商用、超6000颗星

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×