跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

数据预处理

Llama 4开源空降!1000万超长上下文、单GPU可跑,还有近2万亿参数巨模型

上午11时 2025/04/06 作者 智东西

。
编译 |
ZeR0
编辑 |
漠影
智东西4月6日报道,今日,Meta发布Llama 4系列首批

分类 资讯 标签 Llama 4、 Meta、 偏见、 安全性、 数据预处理、 模型特性 发表评论

掌握线性状态空间:从零构建一个Mamba神经网络架构

上午8时 2025/04/02 作者 极市干货

开始构建 Mamba 的全部代码过程,作者将Mamba算法模型从理论转化为具体实践。这一探索过程不仅

分类 学术 标签 Hugging Face、 Mamba模型、 性能优化、 数据预处理、 梯度累积、 调试日志 发表评论

模型训练前置处理之——数据预处理

下午2时 2025/03/06 作者 AI探索时代

数据预处理是神经网络的重要环节,涉及数据清洗、转换和压缩等步骤,以提升模型性能。

分类 大模型 标签 Qwen、 人工智能、 复杂过程、 数据预处理、 神经网络、 阿里巴巴云 发表评论

用LLM做文本分类,微调选base还是chat

下午2时 2025/01/13 作者 Datawhale

作者:LeonYi
链接:https://www.zhihu.com/question/632473

分类 分享 标签 交叉验证、 分类任务、 小样本学习能力、 微调策略、 数据预处理、 模型选择 发表评论

北航&ZGCLAB提出XRAG:首个高级检索增强生成的基准测试

上午8时 2025/01/01 作者 PaperWeekly

首个全面的 RAG 的测评 Benchmark 与 Toolkit 终于来了,ZGCLAB 与北航提

分类 大模型、 学术 标签 RAG模型、 数据预处理、 文本生成、 检索组件、 系统架构、 隐私安全 发表评论

AI 取代低技能工作?别慌,这些领域仍是人类主场|独家对话 OpenAI 前研究员和中关村科金总裁

上午8时 2024/12/12 作者 AI前线

作者|冬梅
采访嘉宾|喻友平,中关村科金总裁;Kenneth Stanley,OpenAI 前杰出研

分类 资讯 标签 人工智能、 人才培养、 客户服务、 客户理解、 数据预处理、 金融 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 采用 DACA 设计模式从零开始学习 Agentic AI 的教程:Learn Agentic AI
  • llama.cpp 内置的 llama-server 终于支持视觉模型
  • 一个完整的多模态推理模型发展全景图
  • 告别OCR!无需OCR的开源文档提取神器:DocExt,VLM驱动,安全高效!
  • DeerFlow:深度研究的利器,结合语言模型与多种工具,助力高效研究与知识探索

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×