跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Qwen

因为AI,阿里终于被市场看作一家要做102年的公司了

2025年2月21日12时 作者 硅星人Pro

次“历史转折”。
以前的阿里财报发布后,电话会上全是“GMV在哪里”的提问;而刚刚发布的2025财年

分类 资讯 标签 AGI、 Qwen、 云服务、 夸克平台、 开源路线、 自由现金流下降 发表评论

开源本地化 RAG 系统Minima

2025年2月19日12时 作者 GitHubStore

开源的基于容器的 RAG 系统,支持本地和外部 AI 服务,专注于安全地查询本地文档。

分类 开源 标签 Minima、 Ollama、 PDF、 Qwen、 RAG系统、 Word 发表评论

DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升!

2025年2月17日19时 作者 Datawhale

DeepSeek团队通过CODEI/O项目,利用300多万个实例将代码转换为思考过程训练大模型,提升其在多种推理任务中的性能,并证明了这种训练方法对不同规模和领域模型的有效性。

分类 分享 标签 300万、 CODEI/O、 DeepSeek、 Junlong Li、 Qwen、 验证机制 发表评论

飞书的多维表格接入了DeepSeek R1后,这个时代的玩法,变了。

2025年2月15日8时 作者 开源星探

文章讲述了通过接入DeepSeek R1到飞书多维表格,大幅提升了数据处理效率的故事,并分享了具体操作步骤和实际应用案例。

分类 开源 标签 DeepSeek R1、 Qwen、 可视化图表、 多维表格系统、 数据分析、 阿里云 发表评论

AI 模型幻觉评测榜单:Gemini 2.0 领跑,GPT-4 紧随其后,国产模型智谱领先

2025年2月9日23时 作者 AI工程化

Vectara 发布AI大语言模型幻觉评测榜单,Qwen表现不佳幻觉率2.8%-3.0%。

分类 分享 标签 deepseek v3和r1、 Google Gemini 2.0、 OpenAI o3-mini-high-reasoning、 Qwen、 Vectara、 国产模型智谱glm-9b 1 条评论

DeepSeek-R1 是怎么训练的|深度拆解

2025年2月7日14时 作者 赛博禅心

eepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网:
R1

分类 分享 标签 DeepSeek、 GRPO算法、 Qwen、 R1模型、 奖励机制设计、 模型蒸馏 发表评论

组团开源,Qwen2.5-VL转角遇见DeepSeek Janus-Pro!

2025年1月28日14时 作者 PaperAgent

今天除夕,阿里千问开源了Qwen2.5-VL模型,包含3B、7B和72B三个尺寸,并具有感知丰富世界、作为视觉Agent、理解长视频和捕捉事件、精准的视觉定位及结构化输出等新特性。

分类 分享 标签 72B、 Qwen、 多模态模型、 视觉理解和操作、 阿里千问、 预训练语言模型 发表评论

Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

2025年1月27日16时 作者 量子位

阿里云Qwen模型首次将上下文扩展至1M长度,实现了长文本任务的稳定超越GPT-4o-mini,并提升了推理速度7倍。该模型分为长上下文训练、长度外推和稀疏注意力机制三大步骤。

分类 资讯 标签 1M长度、 7倍提速、 Qwen、 上下文扩展、 提升效果、 稀疏注意力机制 发表评论

阿里Qwen2.5-1M开源,仅320G可推理14B百万token

2025年1月27日14时 作者 PaperAgent

阿里千问开源了Qwen 2.5-1M模型及其对应的推理框架,支持百万Token上下文处理,并分享了训练和推理框架的设计细节及消融实验结果。

分类 分享 标签 1M长度、 Qwen、 上下文长度、 消融实验、 稀疏注意力、 阿里云 发表评论

DeepSeek R1 – 最强大的开源推理模型:包含经过蒸馏优化的 Llama 和 Qwen 模型

2025年1月24日16时 作者 NLP工程化

DeepSeek R1开源模型发布,包括Llama和Qwen蒸馏版本,支持GGUF格式和4位量化,7B模型压缩至4.68G。

分类 开源 标签 7B量化、 DeepSeek R1、 GGUF格式、 Llama、 Qwen、 深度学习蒸馏 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面8 页面9 页面10 页面11 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 10 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×